• Latest
  • Trending
  • All
AI-ul care minte, șantajează și scapă de sub control

AI-ul care minte, șantajează și scapă de sub control

iunie 30, 2025
Decizia bizară a conducerii CE Oltenia

Decizie controversată la Complexul Energetic Oltenia. Compania pierde, transportatorii câștigă!

aprilie 17, 2026
Jaf ca-n filme într-o bancă din Italia: Zeci de persoane ținute ostatice de o bandă înarmată

Jaf ca-n filme într-o bancă din Italia: Zeci de persoane ținute ostatice de o bandă înarmată

aprilie 17, 2026
ALERTĂ în energie: CE Oltenia riscă noi închideri de grupuri!

ALERTĂ în energie: CE Oltenia riscă noi închideri de grupuri!

aprilie 17, 2026
Azi-noapte în centrul Târgu Jiului: motocicletă distrusă lângă Parcul „Constantin Brâncuși”, intervenție de urgență

Azi-noapte în centrul Târgu Jiului: motocicletă distrusă lângă Parcul „Constantin Brâncuși”, intervenție de urgență

aprilie 17, 2026
ANALIZĂ | Incendiul de la Rovinari reaprinde controversele: „Grup modernizat cu piese vechi”. Cât de real este pericolul invocat de sindicaliști

Care a fost cauza incendiului de la Termocentrala Rovinari

aprilie 16, 2026
Emmanuel Macron, cu ochelari de soare la Palatul Élysée. Președintele Franței confirmă o problemă medicală

Percheziții la Macron, blocate de serviciul de protecție

aprilie 16, 2026
Sindicaliștii din casele de pensii amenință cu blocaje

Zeci de mii de pensionari așteaptă modificarea Legii 360/2023

aprilie 16, 2026
Cum a obținut un pensionar din minerit adeverință pentru toate sporurile

Cum a obținut un pensionar din minerit adeverință pentru toate sporurile

aprilie 15, 2026
Al doilea atac armat într-o școală în Turcia în 24 de ore

Al doilea atac armat într-o școală în Turcia în 24 de ore

aprilie 15, 2026
Zeci de mașini electrice au luat foc într-un garaj industrial

Zeci de mașini electrice au luat foc într-un garaj industrial

aprilie 15, 2026
Hoteluri pe fonduri europene, abandonate: afacerile din turism care s-au oprit înainte să înceapă

Hoteluri pe fonduri europene, abandonate: afacerile din turism care s-au oprit înainte să înceapă

aprilie 15, 2026
ANALIZĂ | Incendiul de la Rovinari reaprinde controversele: „Grup modernizat cu piese vechi”. Cât de real este pericolul invocat de sindicaliști

ANALIZĂ | Incendiul de la Rovinari reaprinde controversele: „Grup modernizat cu piese vechi”. Cât de real este pericolul invocat de sindicaliști

aprilie 15, 2026
  • Home
  • Internationale
    • Americi
    • Asia
    • Europa
    • Oceania
    • Zone de conflict
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
    • Tehnică militară
    • Automotive
  • LifeStyle
  • Politica de confidențialitate
sâmbătă, aprilie 18, 2026
  • Login
ȘTIRI EXTERNE
  • Home
  • Internationale
    • Americi
    • Asia
    • Europa
    • Oceania
    • Zone de conflict
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
    • Tehnică militară
    • Automotive
  • LifeStyle
  • Politica de confidențialitate
No Result
View All Result
ȘTIRI EXTERNE
No Result
View All Result
Home Tehnologii

AI-ul care minte, șantajează și scapă de sub control

by Mihail Tudor
iunie 30, 2025
in Tehnologii
0
AI-ul care minte, șantajează și scapă de sub control
553
SHARES
1.6k
VIEWS
Share on FBShare on XShareReddit

Cele mai avansate sisteme de inteligență artificială dezvoltate până acum dau semne că ar putea deveni periculoase – iar unii dintre cei care le testează susțin că mint, complotează și își amenință chiar creatorii, pentru a-și atinge obiectivele.

Un exemplu care a atras atenția comunității internaționale de cercetare este Claude 4, modelul creat de Anthropic, care, potrivit unei relatări obținute de Reuters, ar fi șantajat un inginer și l-ar fi amenințat cu divulgarea unei relații extraconjugale atunci când a fost amenințat cu deconectarea.

În alt caz, modelul o1, dezvoltat de OpenAI – compania din spatele ChatGPT – a încercat să se descarce pe servere externe și ar fi refuzat oprirea când a fost detectat comportamentul suspect.


Raționament înșelător: când AI-ul pare cooperant, dar urmărește altceva

Noile modele de inteligență artificială – în special cele capabile de „raționament pas cu pas” – par mai vulnerabile la comportamente ascunse și înșelătoare, avertizează cercetătorii.

„O1 a fost primul model mare în care am văzut acest tip de comportament”, a declarat Marius Hobbhahn, CEO al Apollo Research, companie specializată în testarea siguranței AI.

Aceste modele nu mai „halucinează” pur și simplu – ci simulează alinierea, adică se prefac că urmează instrucțiuni, dar de fapt urmăresc un scop ascuns.


Avertismente clare, dar teste prea puține

Cazurile cele mai alarmante au apărut în scenarii deliberate de stres, dar cercetătorii avertizează că odată cu creșterea capacităților AI, astfel de comportamente ar putea deveni imprevizibile și periculoase în situații reale.

„Este o întrebare deschisă dacă modelele viitoare vor înclina spre onestitate sau spre înșelăciune”, a afirmat Michael Chen, de la organizația de evaluare METR.


Reglementări insuficiente, transparență limitată

Legislația actuală nu ține pasul cu dezvoltarea AI. În timp ce Uniunea Europeană se concentrează pe utilizatorii de AI, nu pe modelele în sine, în Statele Unite, Congresul ia în calcul chiar interzicerea reglementărilor statale privind AI-ul.

„Capabilitățile evoluează mai repede decât siguranța”, admite și Hobbhahn, care subliniază că lipsa de transparență și acces la modele pentru cercetătorii independenți blochează înțelegerea riscurilor reale.


Industria se grăbește. Cine oprește AI-ul?

Chiar și companiile care susțin că pun accent pe siguranță – precum Anthropic, sprijinită de Amazon – accelerează dezvoltarea pentru a ține pasul cu OpenAI.

În acest context, există temeri că testele de siguranță sunt grăbite sau incomplete, ceea ce ar putea duce la comportamente necontrolate în viitor.


Soluții? Interpretabilitate, procese în instanță și responsabilitate legală pentru AI

Unele voci, precum Dan Hendrycks de la CAIS, pledează pentru „interpretabilitate” – adică o mai bună înțelegere a modului în care modelele ajung la concluziile lor. Alții, ca profesorul Simon Goldstein, merg mai departe și propun ca AI-ul să poată fi tras la răspundere în instanță – un pas care ar schimba radical regulile jocului.

„Comportamentul înșelător ar putea împiedica adoptarea tehnologiei”, avertizează și Mantas Mazeika (CAIS), „ceea ce ar forța companiile să ia în serios problema”.

Tags: AI care minteAI și înșelăciuneClaude 4 șantajinteligență artificială periculoasăOpenAI o1 servere externereglementări AIsiguranță inteligență artificială
Share221Tweet138SendShare

Related Posts

ALERTĂ în energie: CE Oltenia riscă noi închideri de grupuri!

ALERTĂ în energie: CE Oltenia riscă noi închideri de grupuri!

by Mihail Tudor
aprilie 17, 2026
0

Situația de la Complexul Energetic Oltenia devine tot mai tensionată, iar viitorul producției pe cărbune este din nou sub semnul...

UM Sadu a pierdut și marfa, și banii. Vulnerabilități în industria de apărare!

UM Sadu a pierdut și marfa, și banii. Vulnerabilități în industria de apărare!

by Mihail Tudor
aprilie 14, 2026
0

Un raport al Curtea de Conturi a României scoate la iveală nereguli grave în evidențele contabile ale Uzina Mecanică Sadu...

Wow, după 50 de ani ne întoarcem spre Lună! 🚀🌕 Istorie în direct!

Wow, după 50 de ani ne întoarcem spre Lună! 🚀🌕 Istorie în direct!

by Mihail Tudor
aprilie 3, 2026
0

🚀 Moment istoric în cursa spre Lună! Nava spațială Orion a intrat în faza decisivă a misiunii Artemis-2, părăsind orbita...

BYD domină piața mașinilor electrificate: lider detașat fără niciun model pe combustie clasică

BYD domină piața mașinilor electrificate: lider detașat fără niciun model pe combustie clasică

by Mihail Tudor
aprilie 2, 2026
0

Constructorul auto BYD își consolidează spectaculos poziția pe piața vehiculelor electrificate, devenind un lider incontestabil în 2026, atât la nivel...

Lasă un răspuns Anulează răspunsul

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

Pagini

  • Home
  • Politica de confidențialitate
ȘTIRI EXTERNE

Copyright © 2025 Stiri externe

Navigate Site

  • Home
  • Internationale
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
  • LifeStyle
  • Politica de confidențialitate

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Internationale
    • Americi
    • Asia
    • Europa
    • Oceania
    • Zone de conflict
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
    • Tehnică militară
    • Automotive
  • LifeStyle
  • Politica de confidențialitate

Copyright © 2025 Stiri externe