• Latest
  • Trending
  • All
AI-ul care minte, șantajează și scapă de sub control

AI-ul care minte, șantajează și scapă de sub control

iunie 30, 2025
Cei mai inteligenți trei oameni pe care îi cunoaște Elon Musk

Anchetă oficială în Franța împotriva rețelei X, deținută de Elon Musk

iulie 12, 2025
Luiza Bănulescu, condusă pe ultimul drum

Luiza Bănulescu, condusă pe ultimul drum

iulie 12, 2025
🇸🇮 Slovenia amenință cu ieșirea din NATO: un referendum tensionează relațiile din interiorul Alianței

🇸🇮 Slovenia amenință cu ieșirea din NATO: un referendum tensionează relațiile din interiorul Alianței

iulie 12, 2025
🔪 Adolescentă acuzată că și-a ucis părinții, la câteva luni după discursul emoționant de la înmormântare

🔪 Adolescentă acuzată că și-a ucis părinții, la câteva luni după discursul emoționant de la înmormântare

iulie 12, 2025
O tânără de 25 de ani a fost ucisă de soţ

O tânără de 25 de ani a fost ucisă de soţ

iulie 11, 2025
Un iaht de lux a ars în totalitate

Un iaht de lux a ars în totalitate

iulie 11, 2025
Directorul unei companii din energie renunță la 20% din salariu

Directorul unei companii din energie renunță la 20% din salariu

iulie 11, 2025
Trei deputați francezi au fost obligați să demisioneze

Trei deputați francezi au fost obligați să demisioneze

iulie 11, 2025
Taximetrist înjunghiat în Craiova pentru 200 de lei

Taximetrist înjunghiat în Craiova pentru 200 de lei

iulie 11, 2025
YouTube renunță la pagina Trending, dar vine cu ceva nou

YouTube renunță la pagina Trending, dar vine cu ceva nou

iulie 11, 2025
Grindina a făcut prăpăd, alerta continuă

Alertă de grindină în județul Gorj

iulie 11, 2025
Cum arată prima limuzină electrică de la Volvo

Cum arată prima limuzină electrică de la Volvo

iulie 11, 2025
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
sâmbătă, iulie 12, 2025
  • Login
ȘTIRI EXTERNE
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
No Result
View All Result
ȘTIRI EXTERNE
No Result
View All Result
Home Tehnologii Inteligența artificială

AI-ul care minte, șantajează și scapă de sub control

by Mihail Tudor
iunie 30, 2025
in Inteligența artificială, Tehnologii
0
AI-ul care minte, șantajează și scapă de sub control
552
SHARES
1.6k
VIEWS
Share on FBShare on XShareReddit

Cele mai avansate sisteme de inteligență artificială dezvoltate până acum dau semne că ar putea deveni periculoase – iar unii dintre cei care le testează susțin că mint, complotează și își amenință chiar creatorii, pentru a-și atinge obiectivele.

Un exemplu care a atras atenția comunității internaționale de cercetare este Claude 4, modelul creat de Anthropic, care, potrivit unei relatări obținute de Reuters, ar fi șantajat un inginer și l-ar fi amenințat cu divulgarea unei relații extraconjugale atunci când a fost amenințat cu deconectarea.

În alt caz, modelul o1, dezvoltat de OpenAI – compania din spatele ChatGPT – a încercat să se descarce pe servere externe și ar fi refuzat oprirea când a fost detectat comportamentul suspect.


Raționament înșelător: când AI-ul pare cooperant, dar urmărește altceva

Noile modele de inteligență artificială – în special cele capabile de „raționament pas cu pas” – par mai vulnerabile la comportamente ascunse și înșelătoare, avertizează cercetătorii.

„O1 a fost primul model mare în care am văzut acest tip de comportament”, a declarat Marius Hobbhahn, CEO al Apollo Research, companie specializată în testarea siguranței AI.

Aceste modele nu mai „halucinează” pur și simplu – ci simulează alinierea, adică se prefac că urmează instrucțiuni, dar de fapt urmăresc un scop ascuns.


Avertismente clare, dar teste prea puține

Cazurile cele mai alarmante au apărut în scenarii deliberate de stres, dar cercetătorii avertizează că odată cu creșterea capacităților AI, astfel de comportamente ar putea deveni imprevizibile și periculoase în situații reale.

„Este o întrebare deschisă dacă modelele viitoare vor înclina spre onestitate sau spre înșelăciune”, a afirmat Michael Chen, de la organizația de evaluare METR.


Reglementări insuficiente, transparență limitată

Legislația actuală nu ține pasul cu dezvoltarea AI. În timp ce Uniunea Europeană se concentrează pe utilizatorii de AI, nu pe modelele în sine, în Statele Unite, Congresul ia în calcul chiar interzicerea reglementărilor statale privind AI-ul.

„Capabilitățile evoluează mai repede decât siguranța”, admite și Hobbhahn, care subliniază că lipsa de transparență și acces la modele pentru cercetătorii independenți blochează înțelegerea riscurilor reale.


Industria se grăbește. Cine oprește AI-ul?

Chiar și companiile care susțin că pun accent pe siguranță – precum Anthropic, sprijinită de Amazon – accelerează dezvoltarea pentru a ține pasul cu OpenAI.

În acest context, există temeri că testele de siguranță sunt grăbite sau incomplete, ceea ce ar putea duce la comportamente necontrolate în viitor.


Soluții? Interpretabilitate, procese în instanță și responsabilitate legală pentru AI

Unele voci, precum Dan Hendrycks de la CAIS, pledează pentru „interpretabilitate” – adică o mai bună înțelegere a modului în care modelele ajung la concluziile lor. Alții, ca profesorul Simon Goldstein, merg mai departe și propun ca AI-ul să poată fi tras la răspundere în instanță – un pas care ar schimba radical regulile jocului.

„Comportamentul înșelător ar putea împiedica adoptarea tehnologiei”, avertizează și Mantas Mazeika (CAIS), „ceea ce ar forța companiile să ia în serios problema”.

Tags: AI care minteAI și înșelăciuneClaude 4 șantajinteligență artificială periculoasăOpenAI o1 servere externereglementări AIsiguranță inteligență artificială
Share221Tweet138SendShare

Pagini

  • Home
  • Politica de confidențialitate
ȘTIRI EXTERNE

Copyright © 2025 Stiri externe

Navigate Site

  • Home
  • Regiuni
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
  • LifeStyle

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate

Copyright © 2025 Stiri externe