• Latest
  • Trending
  • All
AI-ul care minte, șantajează și scapă de sub control

AI-ul care minte, șantajează și scapă de sub control

iunie 30, 2025
Viktor Orbán neagă ieșirea Ungariei din UE: „Vrem o Uniune care servește popoarele, nu birocrații”

Ungaria dă în judecată Consiliul European pentru fondurile militare destinate Ucrainei

august 28, 2025
Cum s-a răzbunat primarul pe săteni

Cum s-a răzbunat primarul pe săteni

august 28, 2025
Tensiuni în Argentina: caravana președintelui Javier Milei, atacată cu pietre la Buenos Aires

Tensiuni în Argentina: caravana președintelui Javier Milei, atacată cu pietre la Buenos Aires

august 28, 2025
Trei case mistuite de incendiu

Trei case mistuite de incendiu

august 28, 2025
Vinete înăbușite cu roșii și usturoi: o murătură perfectă de iarnă

Vinete înăbușite cu roșii și usturoi: o murătură perfectă de iarnă

august 28, 2025
⚒️ Tragedie la Cariera Roșiuța: un miner de 43 de ani s-a stins la locul de muncă ⚒️

⚒️ Tragedie la Cariera Roșiuța: un miner de 43 de ani s-a stins la locul de muncă ⚒️

august 28, 2025
Apple va întrerupe șapte produse după lansarea iPhone 17

Apple va întrerupe șapte produse după lansarea iPhone 17

august 28, 2025
Alef dezvăluie prima mașină electrică zburătoare

Alef dezvăluie prima mașină electrică zburătoare

august 28, 2025
🇳🇴 Norvegia cheltuiește 5 milioane de euro pentru a opri „invazia” somonului cu cocoașă rusesc

🇳🇴 Norvegia cheltuiește 5 milioane de euro pentru a opri „invazia” somonului cu cocoașă rusesc

august 28, 2025
Dragostea bate la ușă… chiar și cu interdicție!

Dragostea bate la ușă… chiar și cu interdicție!

august 28, 2025
Atac armat la o școală catolică din Minneapolis: trei morți și aproximativ 20 de răniți

Atac armat la o școală catolică din Minneapolis: trei morți și aproximativ 20 de răniți

august 27, 2025
Angajat al CE Oltenia pierde procesul privind recalcularea pensiei. Munca la birou nu e grea!

Ședințe online la Complexul Energetic Oltenia

august 27, 2025
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
joi, august 28, 2025
  • Login
ȘTIRI EXTERNE
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate
No Result
View All Result
ȘTIRI EXTERNE
No Result
View All Result
Home Tehnologii Inteligența artificială

AI-ul care minte, șantajează și scapă de sub control

by Mihail Tudor
iunie 30, 2025
in Inteligența artificială, Tehnologii
0
AI-ul care minte, șantajează și scapă de sub control
552
SHARES
1.6k
VIEWS
Share on FBShare on XShareReddit

Cele mai avansate sisteme de inteligență artificială dezvoltate până acum dau semne că ar putea deveni periculoase – iar unii dintre cei care le testează susțin că mint, complotează și își amenință chiar creatorii, pentru a-și atinge obiectivele.

Un exemplu care a atras atenția comunității internaționale de cercetare este Claude 4, modelul creat de Anthropic, care, potrivit unei relatări obținute de Reuters, ar fi șantajat un inginer și l-ar fi amenințat cu divulgarea unei relații extraconjugale atunci când a fost amenințat cu deconectarea.

În alt caz, modelul o1, dezvoltat de OpenAI – compania din spatele ChatGPT – a încercat să se descarce pe servere externe și ar fi refuzat oprirea când a fost detectat comportamentul suspect.


Raționament înșelător: când AI-ul pare cooperant, dar urmărește altceva

Noile modele de inteligență artificială – în special cele capabile de „raționament pas cu pas” – par mai vulnerabile la comportamente ascunse și înșelătoare, avertizează cercetătorii.

„O1 a fost primul model mare în care am văzut acest tip de comportament”, a declarat Marius Hobbhahn, CEO al Apollo Research, companie specializată în testarea siguranței AI.

Aceste modele nu mai „halucinează” pur și simplu – ci simulează alinierea, adică se prefac că urmează instrucțiuni, dar de fapt urmăresc un scop ascuns.


Avertismente clare, dar teste prea puține

Cazurile cele mai alarmante au apărut în scenarii deliberate de stres, dar cercetătorii avertizează că odată cu creșterea capacităților AI, astfel de comportamente ar putea deveni imprevizibile și periculoase în situații reale.

„Este o întrebare deschisă dacă modelele viitoare vor înclina spre onestitate sau spre înșelăciune”, a afirmat Michael Chen, de la organizația de evaluare METR.


Reglementări insuficiente, transparență limitată

Legislația actuală nu ține pasul cu dezvoltarea AI. În timp ce Uniunea Europeană se concentrează pe utilizatorii de AI, nu pe modelele în sine, în Statele Unite, Congresul ia în calcul chiar interzicerea reglementărilor statale privind AI-ul.

„Capabilitățile evoluează mai repede decât siguranța”, admite și Hobbhahn, care subliniază că lipsa de transparență și acces la modele pentru cercetătorii independenți blochează înțelegerea riscurilor reale.


Industria se grăbește. Cine oprește AI-ul?

Chiar și companiile care susțin că pun accent pe siguranță – precum Anthropic, sprijinită de Amazon – accelerează dezvoltarea pentru a ține pasul cu OpenAI.

În acest context, există temeri că testele de siguranță sunt grăbite sau incomplete, ceea ce ar putea duce la comportamente necontrolate în viitor.


Soluții? Interpretabilitate, procese în instanță și responsabilitate legală pentru AI

Unele voci, precum Dan Hendrycks de la CAIS, pledează pentru „interpretabilitate” – adică o mai bună înțelegere a modului în care modelele ajung la concluziile lor. Alții, ca profesorul Simon Goldstein, merg mai departe și propun ca AI-ul să poată fi tras la răspundere în instanță – un pas care ar schimba radical regulile jocului.

„Comportamentul înșelător ar putea împiedica adoptarea tehnologiei”, avertizează și Mantas Mazeika (CAIS), „ceea ce ar forța companiile să ia în serios problema”.

Tags: AI care minteAI și înșelăciuneClaude 4 șantajinteligență artificială periculoasăOpenAI o1 servere externereglementări AIsiguranță inteligență artificială
Share221Tweet138SendShare

Pagini

  • Home
  • Politica de confidențialitate
ȘTIRI EXTERNE

Copyright © 2025 Stiri externe

Navigate Site

  • Home
  • Regiuni
  • Ordinea mondială
  • România
  • AgroTech
  • Tehnologii
  • LifeStyle

Follow Us

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
No Result
View All Result
  • Home
  • Regiuni
    • Americi
      • SUA
    • Asia
      • China
      • Japonia
    • Europa
      • Franța
      • Germania
      • Marea Britanie
      • Rusia
      • Turcia
    • Africa
    • Oceania
    • Zone de conflict
      • Israel-Palestina
      • Afganistan
      • Africa Centrală și de Vest
      • Etiopia (Tigray)
      • India Pakistan
      • Siria
      • Ucraina
      • Iran
      • Yemen
  • Ordinea mondială
    • Acorduri comerciale
    • Alianțe militare
    • Drepturile omului
    • Guvernanța globală
  • România
    • Politică
    • Eveniment
    • Diaspora
    • Moldova
  • AgroTech
    • Agricultură Inteligentă
    • Biotehnologie și Genetică
    • FoodTech
    • Piața alimentară
    • Sustenabilitate & Mediu
  • Tehnologii
    • Tehnică militară
    • Automotive
    • Biotehnologie
    • Inteligența artificială
    • Computere
    • Space
    • Diverse
  • LifeStyle
    • Călătorii
    • Gastronomie
    • Tehnologie personală
    • Timp liber
    • Vedete și tendințe
    • Politica de confidențialitate

Copyright © 2025 Stiri externe