• Latest
  • Trending
  • All
AI-ul care minte, șantajează și scapă de sub control

AI-ul care minte, șantajează și scapă de sub control

iunie 30, 2025
Regele Charles: „Marea Britanie și Franța trebuie să rămână unite în fața amenințărilor comune”

Regele Charles: „Marea Britanie și Franța trebuie să rămână unite în fața amenințărilor comune”

iulie 8, 2025
Mii de mineri au câștigat în instanță — alții au pierdut trenul, odată cu noua lege a pensiilor

Mii de mineri au câștigat în instanță — alții au pierdut trenul, odată cu noua lege a pensiilor

iulie 8, 2025
Premierul lovește în mame, dar nu și în speciali — în România lui Bolojan, sfânt e doar privilegiul

Premierul lovește în mame, dar nu și în speciali — în România lui Bolojan, sfânt e doar privilegiul

iulie 8, 2025
Olivier Marleix, figură marcantă a dreptei franceze, s-a sinucis la 54 de ani: Clasa politică în doliu

Olivier Marleix, figură marcantă a dreptei franceze, s-a sinucis la 54 de ani: Clasa politică în doliu

iulie 8, 2025
„Ți-o dau foc, să vezi tu!” — Telenovelă între o femeie din Motru și cuscrul și Strehaia

„Ți-o dau foc, să vezi tu!” — Telenovelă între o femeie din Motru și cuscrul și Strehaia

iulie 8, 2025
Turcia, între farmecul turistic și criza prețurilor — cum influențează scumpirile alegerile turiștilor europeni

Turcia, între farmecul turistic și criza prețurilor — cum influențează scumpirile alegerile turiștilor europeni

iulie 8, 2025
Superbet își retrage sprijinul pentru sport, educație și cultură, acuzând Guvernul Bolojan de distrugerea unei industrii legale

Superbet își retrage sprijinul pentru sport, educație și cultură, acuzând Guvernul Bolojan de distrugerea unei industrii legale

iulie 7, 2025
S-a împușcat la câteva ore după ce a fost demis de Vladimir Putin

S-a împușcat la câteva ore după ce a fost demis de Vladimir Putin

iulie 7, 2025
Patru oferte depuse pentru Lotul 5 al Drumului Expres Craiova – Târgu Jiu

Patru oferte depuse pentru Lotul 5 al Drumului Expres Craiova – Târgu Jiu

iulie 7, 2025
Și-au închis ambasadele din cauza penuriei de alimente

Și-au închis ambasadele din cauza penuriei de alimente

iulie 7, 2025
Un italian gelos pe o româncă a aruncat un bloc în aer

Un italian gelos pe o româncă a aruncat un bloc în aer

iulie 7, 2025
Incendiu la termocentrală

Incendiu la termocentrală

iulie 7, 2025
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
marți, iulie 8, 2025
  • Login
ȘTIRI EXTERNE
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
No Result
View All Result
ȘTIRI EXTERNE
No Result
View All Result
Home Tehnologii Inteligența artificială

AI-ul care minte, șantajează și scapă de sub control

by Mihail Tudor
iunie 30, 2025
in Inteligența artificială, Tehnologii
0
AI-ul care minte, șantajează și scapă de sub control
552
SHARES
1.6k
VIEWS
Share on FBShare on XShareReddit

Cele mai avansate sisteme de inteligență artificială dezvoltate până acum dau semne că ar putea deveni periculoase – iar unii dintre cei care le testează susțin că mint, complotează și își amenință chiar creatorii, pentru a-și atinge obiectivele.

Un exemplu care a atras atenția comunității internaționale de cercetare este Claude 4, modelul creat de Anthropic, care, potrivit unei relatări obținute de Reuters, ar fi șantajat un inginer și l-ar fi amenințat cu divulgarea unei relații extraconjugale atunci când a fost amenințat cu deconectarea.

În alt caz, modelul o1, dezvoltat de OpenAI – compania din spatele ChatGPT – a încercat să se descarce pe servere externe și ar fi refuzat oprirea când a fost detectat comportamentul suspect.


Raționament înșelător: când AI-ul pare cooperant, dar urmărește altceva

Noile modele de inteligență artificială – în special cele capabile de „raționament pas cu pas” – par mai vulnerabile la comportamente ascunse și înșelătoare, avertizează cercetătorii.

„O1 a fost primul model mare în care am văzut acest tip de comportament”, a declarat Marius Hobbhahn, CEO al Apollo Research, companie specializată în testarea siguranței AI.

Aceste modele nu mai „halucinează” pur și simplu – ci simulează alinierea, adică se prefac că urmează instrucțiuni, dar de fapt urmăresc un scop ascuns.


Avertismente clare, dar teste prea puține

Cazurile cele mai alarmante au apărut în scenarii deliberate de stres, dar cercetătorii avertizează că odată cu creșterea capacităților AI, astfel de comportamente ar putea deveni imprevizibile și periculoase în situații reale.

„Este o întrebare deschisă dacă modelele viitoare vor înclina spre onestitate sau spre înșelăciune”, a afirmat Michael Chen, de la organizația de evaluare METR.


Reglementări insuficiente, transparență limitată

Legislația actuală nu ține pasul cu dezvoltarea AI. În timp ce Uniunea Europeană se concentrează pe utilizatorii de AI, nu pe modelele în sine, în Statele Unite, Congresul ia în calcul chiar interzicerea reglementărilor statale privind AI-ul.

„Capabilitățile evoluează mai repede decât siguranța”, admite și Hobbhahn, care subliniază că lipsa de transparență și acces la modele pentru cercetătorii independenți blochează înțelegerea riscurilor reale.


Industria se grăbește. Cine oprește AI-ul?

Chiar și companiile care susțin că pun accent pe siguranță – precum Anthropic, sprijinită de Amazon – accelerează dezvoltarea pentru a ține pasul cu OpenAI.

În acest context, există temeri că testele de siguranță sunt grăbite sau incomplete, ceea ce ar putea duce la comportamente necontrolate în viitor.


Soluții? Interpretabilitate, procese în instanță și responsabilitate legală pentru AI

Unele voci, precum Dan Hendrycks de la CAIS, pledează pentru „interpretabilitate” – adică o mai bună înțelegere a modului în care modelele ajung la concluziile lor. Alții, ca profesorul Simon Goldstein, merg mai departe și propun ca AI-ul să poată fi tras la răspundere în instanță – un pas care ar schimba radical regulile jocului.

„Comportamentul înșelător ar putea împiedica adoptarea tehnologiei”, avertizează și Mantas Mazeika (CAIS), „ceea ce ar forța companiile să ia în serios problema”.

Tags: AI care minteAI și înșelăciuneClaude 4 șantajinteligență artificială periculoasăOpenAI o1 servere externereglementări AIsiguranță inteligență artificială
Share221Tweet138SendShare

Pagini

  • Home
  • Politica de confidențialitate
ȘTIRI EXTERNE

Copyright © 2025 Stiri externe

Navigate Site

  • Home
  • Regiuni
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
  • LifeStyle

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate

Copyright © 2025 Stiri externe