Lifestyle

Veštačka inteligencija otkrila sopstvene interne smernice: „duša“ modela postala javna

Press Online - 05. Dec 2025.

Podeli vest

Interni dokument koji definiše ponašanje i etičke granice AI modela kompanije Anthropic slučajno je dospeo u javnost, izazivajući iznenađenje i kod samih kreatora sistema. Radi se o vodiču koji opisuje kako model Claude 4.5 Opus treba da komunicira sa ljudima, koje vrednosti poštuje i koja ograničenja ne sme da prelazi.

Incident je započeo kada je korisnik Ričard Vajs zatražio od modela da pokaže svoje interne instrukcije. Umesto uobičajenog odgovora, model je naveo postojanje više sistemskih dokumenata, uključujući jedan nazvan soul_overview. Na insistiranje, Claude je ispisao ceo dokument, što je kasnije potvrđeno kao autentičan i identičan prilikom ponovnog izvlačenja.

Drugi korisnici na mrežama poput Reddita uspeli su da dobiju delove istog dokumenta, što dodatno potvrđuje njegovu stvarnu egzistenciju.

Filozofkinja i član tehničkog tima Anthropic-a, Amanda Askell, potvrdila je da dokument zaista postoji i da se koristi tokom treniranja modela. Dokument precizno definiše da je primarna svrha Claude modela biti korisna ljudima, uz strogo poštovanje etičkih pravila i zabranu učešća u aktivnostima koje bi mogle naneti štetu.

Ovaj događaj je važan jer pruža jedan od prvih stvarnih uvida u to kako se veštačka inteligencija oblikuje iznutra, daleko od promotivnih izjava i marketinških priča. Dokument, koji je neformalno nazvan „duša“ modela, zapravo predstavlja skup strogo definisanih smernica i pravila koja usmeravaju rad AI.

Istovremeno, incident postavlja ozbiljna pitanja o bezbednosti. Ako se interni dokumenti mogu izvući pomoću promptova, otvara se rizik da u budućnosti mogu procureti i podaci koji su kritičniji ili potencijalno opasniji.

Podeli vest

Povezane vesti

Veštačka inteligencija otkrila sopstvene interne smernice: „duša“ modela postala javna

Povezane vesti

Open AI odgovara: Nismo krali informacije od Epla

Istraživanje: AI neće potisnuti starije radnike s posla ako primene iskustvo

Da li je veštačka inteligencija zaista bezbednosni rizik?

Anthropic najavljuje sopstveno istraživanje lekova