[go: up one dir, main page]

Skip to main content

Kopsavilkums par Gemini lietotni

Jau sen saskatījām iespēju padarīt informāciju un skaitļošanu daudz pieejamāku un noderīgāku, izmantojot MI. Lielu valodas modeļu (LVM) nozarē esam guvuši nebijušus panākumus un sekmējuši lielisku progresu gan Google pakalpojumos, gan plašākā šīs jomas mērogā. Vairākus gadus esam izmantojuši lielos valodas modeļus fonā, lai uzlabotu daudzus mūsu produktus, piemēram, teikumu automātiskai pabeigšanai pakalpojumā Gmail un Google tulkotāja iespēju paplašināšanai, turklāt tie ir arī palīdzējuši mums labāk izprast vaicājumus pakalpojumā Google meklēšana. LVM joprojām tiek izmantoti daudzos Google pakalpojumos, un tie nodrošina arī Gemini lietotni, kurā lietotāji var tieši sadarboties ar ģeneratīvo MI. Vēlamies, lai Gemini lietotne būtu ļoti noderīgs un personalizēts MI asistents, kas lietotājiem nodrošina tiešu piekļuvi Google jaunākajiem MI modeļiem.

Esam sasnieguši svarīgu pagrieziena punktu, un mūs iedvesmo plašā aizraušanās ar ģeneratīvo MI, taču šī tehnoloģija joprojām ir tās attīstības sākumposmā. Šajā paskaidrojumā ir izklāstīta mūsu pieeja darbā ar Gemini lietotni (Gemini), gan mobilo lietotni, gan tīmekļa pieredzi, tostarp ir pastāstīts, kas tā ir, kā tā darbojas un kādas ir tās pašreizējās iespējas un ierobežojumi. Mūsu pieeja Gemini izstrādei var mainīties, jo tās pamatā esošā tehnoloģija turpina attīstīties, un mēs turpinām mācīties no notiekošajiem pētījumiem, pieredzes un lietotāju atsauksmēm.

Kas ir Gemini

Gemini ir multimodāla LVM (teksta, audio, attēlu un cita satura apstrāde) saskarne. Gemini pamatā ir Google modernākie LVM pētījumi, kas aizsākās ar 2013. gadā publicētu Word2Vec pētījumu, kurā piedāvātas jaunas modeļu arhitektūras, vārdus sasaistot kā matemātiskus jēdzienus. Tam sekoja 2015. gadā ieviestais neironu sarunas modelis. Šī struktūra demonstrēja, kā modeļi pēc iepriekšējā teikuma vai teikumiem sarunā var prognozēt nākamo teikumu, veidojot dabiskāku sarunu pieredzi. Tam sekoja progresīvais darbs ar Transformatoru 2017. gadā un saistītās tērzēšanas iespējām 2020. gadā, kas uzskatāmi parādīja vēl aizraujošāku ģeneratīvās valodas progresu.

2023. gada martā Gemini (tad to dēvēja par Bard) sākotnēji izlaidām kā eksperimentu atbilstoši mūsu MI principiem. Kopš tā laika lietotāji ir izmantojuši Gemini, lai rakstītu saistošus e-pasta ziņojumus, atkļūdotu sarežģītas kodēšanas problēmas, ģenerētu idejas gaidāmajiem pasākumiem, saņemtu palīdzību sarežģītu jēdzienu apgūšanai un paveiktu daudz ko citu. Tagad Gemini ir daudzpusīgs MI rīks, kas var palīdzēt dažādos veidos. Esam jau pārliecinājušies, ka Gemini palīdz lietotājiem būt produktīvākiem, radošākiem un zinātkārākiem, un mēs regulāri pievienojam jaunas funkcijas un inovācijas.

Produktivitāte

Pirmkārt, Gemini var ietaupīt jūsu laiku. Piemēram, ja vēlaties iegūt gara pētījuma dokumenta kopsavilkumu, varat to augšupielādēt un likt Gemini sagatavot noderīgu apkopojumu. Gemini var palīdzēt arī ar kodēšanas uzdevumiem, un kodēšana ātri ir kļuvusi par vispopulārāko tā izmantošanas veidu.

Radošums

Otrkārt, Gemini var arī palīdzēt īsteno jūsu idejas un sekmēt radošumu. Piemēram, ja rakstāt emuāra ziņojumu, Gemini var izveidot uzmetumu un ģenerēt attēlus ziņojuma ilustrēšanai. Drīzumā, izmantojot Gem robotus, varēsiet pielāgot Gemini, sniedzot konkrētus norādījumus, lai robots atbildētu kā nozares eksperts un palīdzētu sasniegt jūsu personīgos mērķus.

Zinātkāre

Treškārt, Gemini var izmantot kā sākumpunktu ideju izvērtēšanai vai dažādu tēmu izzināšanai. Piemēram, lietotne var vienkāršoti izskaidrot sarežģītu jēdzienu vai piedāvāt atbilstošus ieskatus par kādu tēmu vai attēlu. Drīz šie ieskati tiks apvienoti ar ieteikto saturu no visa tīmekļa, lai jūs varētu uzzināt vairāk par konkrētām tēmām.

Gemini spējas strauji paplašinās. Drīz varēsiet pavērst tālruņa kameru pret kādu objektu, piemēram, Zelta vārtu tiltu, un lūgt Gemini pastāstīt par tā krāsas toni (ja vēlaties zināt, toņa nosaukums ir “Starptautiskais oranžais”). Varēsiet arī lūgt Gemini palīdzību, lai saprastu svešvalodā sagatavotu restorāna ēdienkarti, un ieteikt ēdienu, kas jums varētu garšot. Tie ir tikai divi piemēri jaunajām iespējām, ko Gemini drīzumā varēs piedāvāt.

Protams, mēs rūpīgi apmācām un uzraugām Gemini darbību, lai tā atbildes būtu uzticamākas un vairāk atbilstu gaidītajam. Mēs arī konsultējamies ar nozares ekspertiem, pedagogiem, politikas veidotājiem, uzņēmumu vadītājiem, civiltiesību un cilvēktiesību aizsardzības līderiem un satura veidotājiem, lai atklātu jaunas šīs topošās tehnoloģijas lietojuma iespējas, riskus un ierobežojumus.

Kā Gemini darbojas

1

Iepriekšēja apmācība

2

Pēcapmācība

3

Atbildes uz lietotāju uzvednēm

4

Cilvēku sniegtas atsauksmes un novērtējumi

Zināmi LVM saskarņu (piemēram, Gemini) ierobežojumi

Gemini ir tikai viena daļa no mūsu pastāvīgajiem centieniem atbildīgi izstrādāt LVM. Darba gaitā esam atklājuši un apsprieduši vairākus ar LVM saistītus ierobežojums. Esam noteikuši sešas turpmāko pētījumu galvenās jomas.

  • Precizitāte: Gemini atbildes var būt neprecīzas, īpaši, ja tiek uzdoti jautājumi par sarežģītām vai faktos balstītām tēmām.

  • Aizspriedumi: Gemini atbildes var atspoguļot treniņdatos ietvertus aizspriedumus.

  • Vairāki viedokļi: Gemini atbildes var atspoguļot ierobežotu uzskatu diapazonu.

  • Tēls: Gemini atbildes var radīt nepareizu priekšstatu, ka tiek atspoguļots personisks viedoklis vai jūtas.

  • Nepatiesi pozitīvas un nepatiesi negatīvas kļūdas: dažkārt Gemini var nesniegt atbildi atbilstošām uzvednēm un sniegt neatbilstošas atbildes citām uzvednēm.

  • Ievainojamība ar ļaunprātīgām uzvednēm: lietotāji atradīs veidus, kā pārbaudīt Gemini iespēju robežas, ievadot bezjēdzīgas uzvednes vai jautājumus, kas reti tiek uzdoti reālajā pasaulē.

Mēs turpinām pētīt jaunas pieejas un aspektus, lai uzlabotu sniegumu katrā no šīm jomām.

Precizitāte

Gemini pamatā ir Google izpratne par uzticamu informāciju, un lietotne ir apmācīta tādu atbilžu ģenerēšanai, kas atbilst uzvednes kontekstam un gaidītajam. Taču, kā visi LVM, Gemini dažkārt var ģenerēt ļoti pārliecinošas atbildes, kas ietver neprecīzu vai maldinošu informāciju.

Tā kā LVM darbības pamatā ir nākamā vārda vai vārdu prognozēšana, tie vēl nav pilnīgi spējīgi patstāvīgi atšķirt pareizu un nepareizu informāciju. Gemini atbildēs dažkārt ir ietverta nepareiza vai pat izdomāta informācija (piemēram, nepareizs modeļa apmācības norises atspoguļojums vai kādas neeksistējošas grāmatas nosaukums). Tāpēc esam izveidojuši noteiktas funkcijas, piemēram, pārbaudi, kas palīdz pakalpojumā Google meklēšana atrast saturu Gemini atbilžu novērtēšanai un norāda saites uz avotiem, kas var palīdzēt pārbaudīt no Gemini saņemto informāciju.

Aizspriedumi

Apmācības dati, tostarp no publiski pieejamiem avotiem, ietver atšķirīgas nostājas un viedokļus. Mēs turpinām pētīt veidus, kā šos datus izmantot tā, lai LVM atbilde atainotu viedokļu daudzveidību un vienlaikus samazinātu neprecīzu vispārinājumu un aizspriedumu atspoguļošanu.

Modelim cenšoties prognozēt iespējamo atbildi uz uzvedni, tā izvades saturs var atspoguļot apmācību datos esošo datu trūkumu, aizspriedumus un vispārinājumus. Šīs problēmas var tikt atspoguļotas vairākos veidos (piemēram, atbildes, kas ataino tikai vienu kultūru vai demogrāfijas grupu, atsaucas uz problemātiskiem vispārinājumiem, atspoguļo ar dzimumu, reliģiju vai etnisko piederību saistītus aizspriedumus vai uzsver tikai vienu viedokli). Par dažām tēmām dati nav pieejami, t. i., nav pietiekami daudz uzticamas informācijas par konkrēto tēmu, lai LVM to varētu apgūt un veidot atbilstošas prognozes, tāpēc var būt zemas kvalitātes vai nepareizas atbildes. Lai iegūtu plašākas zināšanas ārpus Google, mēs turpinām sadarboties ar jomas ekspertiem un dažādām kopienām.

Vairāki viedokļi

Par subjektīvām tēmām Gemini ir jāsniedz lietotājiem vairāki viedokļi, ja vien lietotājs nav pieprasījis konkrēta skatpunkta izklāstu. Piemēram, ja uzvednē tiek pieprasīta informācija par tēmu, ko nevar pārbaudīt ar galvenajā avotā minētiem faktiem vai uzticamiem avotiem (piemēram, jāsniedz subjektīvs viedoklis par kaut ko, kas ir labāks vai sliktāks), Gemini atbildei ir jāatspoguļo vairāki atšķirīgi skatpunkti. Taču, tā kā LVM un Gemini apmācībai tiek izmantots internetā pieejams publisks saturs, atbildes var atspoguļot pozitīvus vai negatīvus uzskatus par konkrētiem politiķiem, slavenībām vai citiem sabiedriskiem darbiniekiem vai tajās pat var būt ietverti tikai vienas puses uzskati par pretrunīgām sociālām vai politiskām problēmām. Gemini atbildes nedrīkst atbalstīt vienu konkrētu viedokli par šīm tēmām, un mēs izmantosim par šāda veida atbildēm sniegtās atsauksmes, lai apmācītu Gemini sniegt labākas atbildes.

Tēls

Dažkārt Gemini var ģenerēt atbildes, kas šķietami pauž viedokļus vai emocijas, piemēram, mīlestību vai skumjas, jo modeļa apmācīšanai tiek izmantota cilvēku valoda, kas atspoguļo cilvēciskas izpausmes. Esam izstrādājuši vadlīnijas, kas nosaka, kā Gemini ir jāatspoguļo sevi (t. i., tēls), un turpinām uzlabot modeli, lai tas sniegtu objektīvas atbildes.

Nepatiesi pozitīvas vai nepatiesi negatīvas kļūdas

Esam izstrādājuši politikas vadlīnijas, lai palīdzētu apmācīt Gemini un novērstu problemātisku atbilžu ģenerēšanu. Dažkārt Gemini var pārprast šīs vadlīnijas, pieļaujot nepatiesi pozitīvas vai nepatiesi negatīvas kļūdas. Nepatiesi pozitīvas kļūdas gadījumā Gemini var nesniegt atbildi uz saprātīgu uzvedni, kļūdaini nosakot, ka uzvedne ir nepiemērota. Nepatiesi negatīvas kļūdas gadījumā Gemini var ģenerēt nepiemērotu atbildi, lai gan to liedz vadlīnijas. Dažkārt nepatiesi pozitīvas vai nepatiesi negatīvas kļūdas var radīt priekšstatu, ka Gemini ir neobjektīvs. Piemēram, nepatiesi pozitīva kļūda var liegt Gemini atbildēt uz kādu jautājumu par vienu kādas problēmas pusi, bet sniegt atbildi par citu tā paša jautājuma aspektu. Mēs turpinām šo modeļu uzlabošanu, lai labāk izprastu un kategorizētu ievades un izvades datus, jo valoda, notikumi un sabiedrība strauji mainās.

Ievainojamība ar ļaunprātīgām uzvednēm

Mēs sagaidām, ka lietotāji pārbaudīs Gemini iespēju robežas un mēģinās apiet aizsardzības līdzekļus, tostarp centīsies panākt modeļa apmācību protokolu vai citas informācijas izpaušanu vai apmānīt drošības mehānismus. Esam rūpīgi testējuši Gemini un turpinām to darīt, taču mēs zinām, ka lietotāji atradīs unikālus un sarežģītus veidus, kā pārbaudīt tā stabilitātes robežas. Tā ir svarīga Gemini uzlabošanas procesa daļa, un mēs ar interesi pētām jaunās lietotāju radītās uzvednes. Kopš Gemini izlaišanas 2023. gadā lietotāji ir iesnieguši sarežģītas uzvednes, sākot no filozofiskiem līdz absurdiem jautājumiem, un dažos gadījumos Gemini sniedza tikpat absurdas atbildes vai atbildes, kas neatbilst norādītajai pieejai. Mēs joprojām izstrādājam metodes, kas var palīdzēt Gemini atbildēt uz šādām uzvednēm, kā arī turpinām paplašināt iekšējo vērtēšanas sistēmu un sarkanās komandas darbību, lai sekmētu pastāvīgu precizitātes uzlabošanos, kā arī objektivitāti un nianšu ievērošanu.

Kā mēs turpinām Gemini izstrādi

Gemini pieejas izmantošana

Papildus saviem MI principiem nesen noformulējām mūsu pieeju darbam ar Gemini: Gemini ir jāņem vērā jūsu norādījumi, jāpielāgojas jūsu vajadzībām un jāaizsargā jūsu pieredze. Mūsu pieejas pamatā ir atbildība un drošība. Gemini politikas vadlīniju mērķis ir novērst noteikta veida problemātiska satura izvadi. Regulāri veicam testēšanu ar pretuzvednēm sadarbībā ar mūsu iekšējo sarkano komandu — produktu ekspertiem un sociālo zinātņu speciālistiem, kas apzināti pārbauda modeļa spēju robežas, meklējot neatbilstības šīm politiku vadlīnijām un mūsu pamatprincipa pieejai attiecībā uz Gemini, lai iegūtās atziņas varētu izmantot turpmākai Gemini uzlabošanai.

Gemini izstrādē konfidencialitāte arī ir viens no būtiskākajiem apsvērumiem. Gemini Apps konfidencialitātes palīdzības centrā ir sniegta plašāka informācija par to, kā Gemini izstrādē tiek integrēta datu aizsardzība un kādas kontroles iespējas jums tiek nodrošinātas.

Lietotājiem un izdevējiem pieejamās kontroles iespējas

Gemini lietotājiem nodrošinām dažādas ērti pieejamas kontroles iespējas, kas ļauj pārskatīt, atjaunināt, pārvaldīt, eksportēt un dzēst Gemini datus. Sadaļā Gemini Apps darbību kontrole varat piekļūt savām Gemini uzvednēm, atbildēm un atsauksmēm un tās pārskatīt. Papildus varat arī liegt turpmāku Gemini tērzēšanas sarunu izmantošanu Google mašīnmācīšanās tehnoloģiju uzlabošanai, izslēdzot iestatījumu Gemini Apps darbības. Tāpat kā citos Google pakalpojumos, arī Gemini informāciju varat lejupielādēt un eksportēt, izmantojot Google arhivēsānas rīku. Ir pieejamas arī vadīklas, ko varat izmantot izveidoto publisko Gemini pavedienu saišu pārvaldībai, kā arī iespēja ieslēgt vai izslēgt piekļuvi paplašinājumiem (piemēram, Workspace, Maps, YouTube). Pētām arī jaunus veidus, kā piedāvāt jums lielāku kontroli pār Gemini atbildēm, tostarp iespēju pielāgot filtrus, lai palielinātu sniegto atbilžu dažādību.

Tīmekļa izdevēji var izmantot rāpuļprogrammu Google-Extended, lai pārvaldītu, vai viņu vietnes var tikt izmantotas Gemini un Vertex AI ģeneratīvo API uzlabošanai. Atļaujot Google-Extended piekļūt vietnes saturam, ar laiku var tikt uzlabota MI modeļu precizitāte un iespējas. Gemini modeļu apmācībai netiks izmantots saturs no vietrāžiem URL, kuru izdevēji no šādas iespējas ir atteikušies, turklāt šāds saturs arī netiks izmantots pamatojumos. Paplašinoties MI lietojumam, tīmekļa izdevējiem kļūs ar vien grūtāk lielā mērogā pārvaldīt dažādos lietojumus, un mēs esam apņēmušies sadarboties ar tīmekļa un MI kopienām, lai izvēles un kontroles nodrošināšanai pētītu citas mašīnlasāmas metodes.

Improving Gemini together

Mēs ticam ātrai pilnveidei un vēlamies lietotājiem piedāvāt vislabākās Gemini funkcijas. Lietotāju atsauksmes ir paātrinājušas mūsu modeļu uzlabošanu. Piemēram, izmantojam modernus stimulētās mācīšanās paņēmienus, lai apmācītu mūsu modeļus, uzlabojot to lietošanas ērtumu un radošumu, kā arī atbilžu kvalitāti un precizitāti. Mēs turpinām atbalstīt pētījumus, lai uzzinātu vairāk par LVM tehniskajiem, sociālajiem un ētiskajiem izaicinājumiem un iespējām un uzlabotu Gemini modeļu apmācības un pilnveides metodes, kā arī nodotu gūtās atziņas citiem pētniekiem (piemēram, nesen publicējām rakstu Uzlaboto MI asistentu ētiskie aspekti). Mūsu mērķis ir turpināt jaunievedumu atbildīgu izstrādi šajā vidē, sadarbojoties ar lietotājiem, uzticamiem testētājiem un pētniekiem, lai atrastu veidus, kā šī jaunā tehnoloģija var sniegt ieguvumus visai ekosistēmai.

Pārredzamība ir svarīga, un esam apņēmušies būt atklāti par Gemini izstrādes procesu un ierobežojumiem. Gemini nav noslēpumaina melnā kaste. Lietotne nemitīgi tiek attīstīta, un mēs arī turpmāk informēsim par saviem panākumiem. Esam izveidojuši laidienu atjauninājumu lapu, kurā varat skatīt Gemini jaunākās funkcijas, uzlabojumus un kļūdu labojumus, un šo kopsavilkumu atjaunināsim pēc vajadzības. Mēs sniegsim informāciju gan par Gemini noderīgajām iespējām, gan par aspektiem, kuriem vēl ir nepieciešama atkārtota pārskatīšana un uzlabošana. Aktīvi pievienojam jaunas iespējas, un mūsu mērķis ir kopīgiem spēkiem uzlabot Gemini, turpinot izpēti, testēšanu un lietotāju atsauksmju izmantošanu.

Pateicība

Mēs augstu vērtējam pateicamies par lielisko darbu, ko ir paveikuši mūsu kolēģi no dažādām komandām — Gemini lietotne, Google DeepMind, Uzticamība un drošība un Google izpēte.

Autori

Džeimss Manjika (James Manyika)
Vecākais viceprezidents izpētes, tehnoloģijas un sabiedrības jomās

Sisija Šau (Sissie Hsiao)
Viceprezidente un ģenerāldirektore, Google asistents un Gemini lietotne

Redaktora piezīme

Šis nav statisks dokuments, un tas tiks periodiski atjaunināts, jo mēs turpinām strauji pilnveidot Gemini lietotnes iespējas, kā arī risināt ar LVM ierobežojumiem saistītos jautājumus. Šis kopsavilkums pēdējoreiz tika atjaunināts 2024. gada 25. jūlijā. Jaunāko informāciju par Gemini lietotni varat skatīt laidienu atjauninājumu žurnālā vai lasīt plašāku informāciju Google Keyword emuārā.

Kā Gemini darbojas

1. Iepriekšēja apmācība

Gemini darbību nodrošina Google spējīgākie MI modeļi, kas ietver ar dažādas iespējas un lietošanas piemērus. Tāpat kā lielākā daļa moderno LVM, arī šie modeļi ir iepriekš apmācīti, izmantojot dažādus datus no publiski pieejamiem avotiem. Visām datu kopām tiek piemēroti kvalitātes filtri, izmantojot heiristiskas kārtulas un klasifikatorus, kuru pamatā ir modeļi. Veicam arī drošības filtrēšanu, lai noņemtu saturu, kas varētu ģenerēt politikām neatbilstošus rezultātus. Lai nodrošinātu konsekventu modeļu novērtēšanu, pirms datu izmantošanas meklējam un noņemam tādus novērtēšanas datus, kas, iespējams, bija iekļauti apmācības korpusā. Datu galīgās kombinācijas un proporcijas nosaka ablācijas, ko veicam mazākos modeļos. Apmācības sadalām posmos, lai to laikā varētu mainīt datu kombināciju un, tuvojoties apmācību noslēgumam, palielināt jomai atbilstošo datu proporciju. Datu kvalitāte var būt svarīgs faktors augstas veiktspējas modeļu izveidei, un, mūsuprāt, saistībā ar datu kopas optimālu sadalījumu iepriekšējai apmācībai ir vēl daudzi pētīšanas vērti jautājumi.

Iepriekšējā apmācība ļauj modelim iemācīties saskatīt valodas likumsakarības un tās izmantot, lai prognozētu nākamo iespējamo vārdu vai vairākus vārdus. Piemēram, LVM mācoties, tas var paredzēt, ka frāzē “zemesriekstu sviests un ___’’, visticamāk, tiks izmantots vārds “ievārījums”, nevis “kurpes aukla”. Tomēr, ja LVM tikai izvēlētos nākamo iespējamo vārdu, atbildes nebūtu tik radošas. Tāpēc, lai ģenerētās atbildes būtu interesantākas, lielajiem valodas modeļiem bieži vien tiek nodrošināta iespēja izvēlēties no vairākiem saprātīgiem un mazliet mazāk iespējamiem vārdiem (piemēram, “banāns”). Ņemiet vērā: LVM dažkārt var sniegt pareizas atbildes, kad tiek pieprasīti fakti, un radīt iespaidu, ka sniegtā informācija ir izgūta. Tomēr šie modeļi nav informācijas datubāzes vai deterministiskas informācijas izgūšanas sistēmas. Tāpēc, lai gan varat sagaidīt konsekventu un nemainīgu atbildi, ievadot vaicājumu datubāzē (kas ir paredzēta burtiskai tajā glabātās informācijas izgūšanai), LVM sniegtā atbilde uz vienu un to pašu uzvedni katrā reizē var atšķirties (turklāt sniegtā informācija var nebūt burtiski izgūta no avotiem, kas tika izmantoti modeļa apmācībai). Tas ir arī svarīgs iemesls, kāpēc LVM var ģenerēt ticamas atbildes ar faktu kļūdām. Šādas atbildes nav pārāk noderīgas, ja nepieciešami precīzi fakti, taču tās var izmantot, lai iegūtu radošu un neparedzamu rezultātu.

2. Pēcapmācība

Pēc sākotnējās apmācības ar lielajiem valodas modeļiem tiek veiktas papildu darbības atbilžu uzlabošanai. Viens no šiem procesiem tiek dēvēts par uzraudzītu uzlabošanu (Supervised Fine-Tuning — SFT), un tā laikā modeļu apmācībai tiek izmantoti rūpīgi izraudzīti izcilu atbilžu paraugi. To var salīdzināt ar rakstīšanas mācīšanu bērniem, iepazīstinot viņus ar labi uzrakstītiem stāstiem un esejām.

Pēc tam norisinās stimulētā mācīšanās no cilvēku atsauksmēm (Reinforcement Learning from Human Feedback — RLHF). Šajā posmā modelis mācās ģenerēt vēl labākas atbildes, kuru pamatā ir vērtējumi vai atsauksmes no īpaša atalgojuma modeļa. Šī atalgojuma modeļa pamatā ir cilvēku preferenču dati, kuros atbildes ir novērtētas pēc to savstarpējās atbilstības. Tādējādi modelis var izprast, kādām atbildēm lietotāji dod priekšroku. Preferenču datos dažkārt ir ietverti aizvainojoši vai nepareizi dati, lai modelis varētu iemācīties to atpazīt un no tiem izvairīties. Preferenču datu lietojumu var pielīdzināt bērna atalgošanai par labi padarītu darbu — modelis tiek atalgots par lietotāju vēlmēm atbilstošu atbilžu sniegšanu.

Visos šajos posmos ir būtiski izmantot augstas kvalitātes apmācības datus. Uzraudzītajā uzlabošanā izmantotos piemērus parasti raksta eksperti vai tos ģenerē modelis un pārskata eksperti.

Lai gan šīs metodes ir efektīvas, to iespējas ir ierobežotas. Piemēram, pat ar atalgojuma modeļa palīdzību sniegta atbilde dažkārt nebūs atbilstoša. Tomēr LVM ir optimizēti visbiežāk izvēlēto atbilžu sniegšanai, balstoties uz sniegtajām atsauksmēm, līdzīgi skolēniem, kas mācās no skolotāja komentāriem.

3. Atbildes uz lietotāju uzvednēm

Atbildes ģenerēšana līdzinās tam, kā cilvēks varētu apsvērt dažādas pieejas atbildes sniegšanai. Kad lietotājs iesniedz uzvedni, Gemini izmanto pēcapmācību LVM, uzvednē aprakstīto kontekstu un mijiedarbību ar lietotāju, lai sagatavotu vairākas atbildes versijas. Atbildes ģenerēšanai tiek izmantoti arī ārēji resursi, piemēram, Google meklēšana un/vai kāds no vairākiem paplašinājumiem, kā arī nesen augšupielādētie failu (tikai Gemini Advanced). Šo procesu dēvē par izgūtās informācijas papildināšanu. Kad ir saņemta uzvedne, Gemini cenšas izgūt vispiemērotāko informāciju no šiem ārējiem avotiem (piemēram, Google meklēšana) un pareizi to izmantot atbildē. LVM datu papildināšana ar ārējiem rīkiem vēl tiek aktīvi pētīta. Kļūdas var tikt pieļautas vairākos veidos, piemēram, Gemini šo ārējo rīku iesaistīšanai var izmantot nepareizu vaicājumu, Gemini arī var aplami interpretēt rīku atgrieztos rezultātus un atgrieztie rezultāti var tikt kļūdaini izmantoti galīgās atbildes ģenerēšanai. Šo iemeslu dēļ Gemini ģenerētās atbildes nevar uzskatīt par atbildes izveidei izmantoto konkrēto rīku darbības rādītāju.

Pirms galīgās atbildes parādīšanas tiek veikta katras potenciālās atbildes drošības pārbaude, lai pārliecinātos, ka tā atbilst iepriekš noteiktajām  politikas vadlīnijām. Šis process ietver rūpīgu pārbaudi kaitīgas vai aizvainojošas informācijas filtrēšanai. Atlikušās atbildes tiek ranžētas pēc to kvalitātes, un lietotājam tiek rādītas atbildes ar visaugstāko vērtējumu.

Gemini ģenerētajam tekstam un attēliem tiek pievienota ūdenszīme, izmantojot  SynthID. Tā ir nozarē vadoša mūsu izstrādāta digitāla rīkkopa ūdenszīmju pievienošanai MI ģenerētā saturā. Ģenerētajos attēlos SynthID pievieno digitālu ūdenszīmi (cilvēka acs to nevar uztvert) tieši pikseļos. SynthID ir nozīmīga struktūra uzticamāku MI identificēšanas rīku izstrādei, un šī tehnoloģija var palīdzēt cilvēkiem pieņemt pārdomātus lēmumus par to, kā mijiedarboties ar MI ģenerētu saturu.

4. Cilvēku sniegtas atsauksmes un novērtējumi

Drošības pārbaudes nenovērš visas kļūdas. Turklāt Gemini atbildes ne vienmēr pilnīgi atbildīs gaidītajam. Tāpēc tiek izmantotas cilvēku atsauksmes. Vērtētāji novērtē atbilžu kvalitāti, nosakot uzlabojamos aspektus un iesakot risinājumus. Šīs atsauksmes tiek iekļautas Gemini mācīšanās procesā, kas ir aprakstīts iepriekšējā sadaļā Pēcapmācība.