U-Turn-ul OpenAI: Nu se va antrena GPT-4 cu datele de la clienții API

schimbari-privind-confidentialitatea-openai-6457d3fd3d25f-sej-760x400.png

Intr-o abatere semnificativa de la practicile sale anterioare, OpenAI a anunțat că nu va mai utiliza datele clienților trimise prin intermediul API-urilor sale pentru a antrena modelele sale de limbaj extinse, cum ar fi GPT-4.

Schimbarea a fost confirmată de Sam Altman, CEO-ul OpenAI, într-un interviu recent cu CNBC.

Abordarea nouă a OpenAI în privința datelor utilizatorilor

Modificarea politicii OpenAI a fost implementată la 1 martie 2023, când compania și-a actualizat în tăcere termenii de serviciu pentru a reflecta această nouă angajare față de confidențialitatea utilizatorilor.

Altman a clarificat: "Clientii doresc in mod evident sa nu ne antrenam pe datele lor, asa ca ne-am schimbat planurile: nu vom face asta".

API-uri, sau interfețe de programare a aplicațiilor, sunt cadre tehnologice care permit clienților să se conecteze direct la software-ul OpenAI.

Altman a declarat că OpenAI nu a mai folosit datele API-ului pentru antrenarea modelului "de ceva timp", sugerând că această declarație oficială formalizează o practică existentă.

Implicații pentru clienții de afaceri

Mutarea OpenAI are implicații de amploare, în special pentru clienții săi de afaceri, care includ gigantii precum Microsoft, Salesforce și Snapchat.

Aceste companii sunt mai susceptibile să utilizeze capacitățile API-ului OpenAI pentru operațiunile lor, așa că schimbarea în ceea ce privește confidențialitatea și protecția datelor este deosebit de relevantă pentru ele.

Însă noile măsuri de protecție a datelor se aplică exclusiv clienților care utilizează serviciile API ale companiei. Termenii de utilizare actualizați ai OpenAI menționează: "Putem utiliza Conținut provenit de la Servicii în afara API-ului nostru."

Ca atare, alte forme de introducere a datelor, cum ar fi textul introdus în cunoscutul chatbot ChatGPT, pot fi încă utilizate de OpenAI, cu excepția cazului în care datele sunt distribuite prin API.

Impact mai larg în industrie

Politica OpenAI vine într-un moment în care industria se confruntă cu impactul potențial al modelelor de limbaj mari, cum ar fi ChatGPT de la OpenAI, înlocuind conținutul creat tradițional de oameni.

De exemplu, Sindicatul Scenariștilor din America a început recent un protest după ce negocierile între Sindicat și studiourile de filme s-au încheiat fără rezultat. Sindicatul a susținut restricții privind utilizarea ChatGPT al OpenAI pentru generarea sau rescrierea scenariilor.

Decizia OpenAI de a nu utiliza datele clienților pentru antrenament marchează un moment esențial în conversația în curs despre confidențialitatea datelor și IA. Pe măsură ce companiile continuă să exploreze și să împingă limitele tehnologiei de IA, asigurarea confidențialității utilizatorului și menținerea încrederii vor rămâne probabil centrale în aceste discuții.

Evoluția ChatGPT: de la GPT-3 la GPT-4

Este important de menționat că angajamentul OpenAI de a nu utiliza datele clienților pentru antrenarea se aplică ultimului său model de limbă, GPT-4, lansat pe 14 martie 2023.

GPT-4 a introdus mai multe îmbunătățiri față de predecesorul său, GPT-3, inclusiv o creștere semnificativă a dimensiunii limită de cuvinte (25.000 în comparație cu limita de 3.000 de cuvinte a ChatGPT), o dimensiune mai mare a ferestrei de context și capacități îmbunătățite de raționament și înțelegere.

Încă o caracteristică remarcabilă a GPT-4 este capacitatea sa de a înțelege și deduce informații din imagini, pe lângă text. Acest model nou generează texte mai asemănătoare cu cele umane, utilizând elemente precum emoji-uri pentru o senzație mai personalizată.

Cu toate acestea, dimensiunea exactă și arhitectura GPT-4 rămân nedezvăluite, ceea ce duce la speculații cu privire la detalii ale modelului.

În ciuda acestor zvonuri, CEO-ul OpenAI a negat afirmațiile specifice despre mărimea modelului.

În ceea ce privește performanța, GPT-4 a demonstrat puncte forte în generarea de texte, dar și anumite limite. De exemplu, a obținut scoruri la percentila 54 în cadrul examenului de scriere Graduate Record Examination (GRE) și a avut performanță în percentila 43-59 în cadrul examenului de Calcul Diferențial și Integral BC (AP Calculus BC).

În plus, a avut o performanță bună la sarcinile ușoare de codificare Leetcode, dar performanța sa a scăzut odată cu creșterea dificultății sarcinilor.

În timp ce detalii specifice despre procesul de instruire al GPT-4 nu sunt documentate oficial, se știe că modelele GPT implică în general învățarea automată la scară largă cu o gamă diversă de text de pe internet.

Înainte privind

Ca rezultat al modificărilor aduse politicilor de utilizare a datelor de către OpenAI, datele folosite pentru antrenarea modelelor sale de limbaj nu includ informațiile partajate prin intermediul API-ului, decât dacă utilizatorii consimt în mod expres să le contribuie în acest scop.

Pe măsură ce această tehnologie se îmbunătățește și joacă un rol tot mai semnificativ în viețile noastre, este interesant cum companiile schimbă direcția și răspund preocupărilor referitoare la păstrarea datelor private și câștigarea încrederii oamenilor.

Articole asociate

Vizualizați mai multe >>

Deblocați puterea AI cu HIX.AI!