[go: up one dir, main page]

Skip to main content

Gemini ആപ്പിന്റെ അവലോകനം

വിവരങ്ങളും കമ്പ്യൂട്ടിംഗും ആളുകൾക്ക് കൂടുതൽ ആക്സസ് ചെയ്യാവുന്നതും ഉപയോഗപ്രദവുമാക്കുന്നതിനുള്ള AI-യുടെ ശേഷി ഞങ്ങൾക്ക് വളരെക്കാലമായി അറിയാം. വലിയ ഭാഷാ മോഡലുകളിൽ (LLM-കൾ) ഞങ്ങൾ നൂതനമായ വികസനങ്ങൾ കൈവരിച്ചിട്ടുണ്ട്, കൂടാതെ Google-ലും ഫീൽഡിൽ ഉടനീളവും ഗണ്യമായ പുരോഗതി കൈവരിക്കാനും കഴിഞ്ഞു. നിരവധി വർഷങ്ങളായി, ഞങ്ങളുടെ നിരവധി ഉൽപ്പന്നങ്ങൾ മെച്ചപ്പെടുത്തുന്നതിനായി അവയുടെ പശ്ചാത്തലത്തിൽ LLM-കൾ ഉപയോഗിക്കുന്നു, ഉദാഹരണത്തിന് Gmail-ൽ വാക്യങ്ങൾ സ്വയമേവ പൂർത്തീകരിക്കൽ, Google Translate വികസിപ്പിക്കൽ, ഞങ്ങളെ Google Search-ലെ ചോദ്യങ്ങൾ നന്നായി മനസ്സിലാക്കാൻ സഹായിക്കൽ. നിരവധി Google സേവനങ്ങൾക്കായും Gemini ആപ്പിനെ ശക്തിപ്പെടുത്താനും ഞങ്ങൾ തുടർന്നും LLM-കൾ ഉപയോഗിക്കുന്നു, ജനറേറ്റീവ് AI-യുമായി നേരിട്ട് കൊളാബറേറ്റ് ചെയ്യാൻ ഇത് ആളുകളെ അനുവദിക്കുന്നു. Google-ന്റെ പുതിയ AI മോഡലുകളിലേക്ക് ഉപയോക്താക്കൾക്ക് നേരിട്ട് ആക്‌സസ് നൽകുന്ന ഏറ്റവും സഹായകരവും വ്യക്തിപരവുമായ AI അസിസ്‌റ്റന്റായി Gemini ആപ്പ് മാറണമെന്ന് ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.

ഞങ്ങൾ നിലവിൽ ഒരു സുപ്രധാന ഘട്ടത്തിലാണ്, ജനറേറ്റീവ് AI-യിലുള്ള താൽപ്പര്യം വ്യാപകമായി വർദ്ധിക്കുന്നതിൽ ഞങ്ങൾ ആവേശഭരിതരാണെങ്കിലും ഈ സാങ്കേതികവിദ്യ ഇപ്പോഴും അതിന്റെ പ്രാരംഭ ഘട്ടത്തിലാണ്. Gemini ആപ്പിന്റെ (“Gemini”) മൊബൈൽ, വെബ് അനുഭവങ്ങൾ ഉൾപ്പെടെ, അതിലെ ഞങ്ങളുടെ പ്രവർത്തനത്തെ ഞങ്ങൾ എങ്ങനെ സമീപിക്കുന്നുവെന്ന് ഈ വിശദീകരണം ഔട്ട്‌ലൈൻ ചെയ്യുന്നു, — അത് എന്താണ്, അത് എങ്ങനെ പ്രവർത്തിക്കുന്നു, അതിന്റെ നിലവിലെ ശേഷികളും പരിമിതികളും. അടിസ്ഥാന സാങ്കേതികവിദ്യ വികസിക്കുന്നതിനും നടന്നുകൊണ്ടിരിക്കുന്ന ഗവേഷണം, അനുഭവം, ഉപയോക്തൃ ഫീഡ്‌ബാക്ക് എന്നിവയിൽ നിന്ന് പഠിക്കുന്നതിനും അനുസരിച്ച്, Gemini നിർമ്മിച്ചെടുക്കുന്നത് സംബന്ധിച്ച ഞങ്ങളുടെ സമീപനം വികസിക്കും.

എന്താണ് Gemini

ഒരു മൾട്ടിമോഡൽ LLM-നുള്ള (ടെക്‌സ്റ്റ്, ഓഡിയോ, ഇമേജുകൾ എന്നിവയും മറ്റും കൈകാര്യം ചെയ്യുന്നത്) ഇന്റർഫേസാണ് Gemini. വാക്കുകളെ ഗണിതശാസ്ത്രപരമായ ആശയങ്ങളായി മാപ്പ് ചെയ്യുന്ന നൂതന മോഡൽ ആർക്കിടെക്ചറുകൾ നിർദ്ദേശിക്കുന്ന 2013-ലെ Word2Vec പേപ്പറിൽ നിന്ന് ആരംഭിച്ച, LLM-കളുമായി ബന്ധപ്പെട്ട Google-ന്റെ അത്യാധുനിക ഗവേഷണത്തിന്റെ അടിസ്ഥാനത്തിലുള്ളതാണ് Gemini, തുടർന്ന് 2015-ൽ ന്യൂറൽ സംഭാഷണ മോഡൽ അവതരിപ്പിച്ചു. മുമ്പത്തെ വാചകത്തെയോ വാചകങ്ങളെയോ അടിസ്ഥാനമാക്കി ഒരു സംഭാഷണത്തിൽ മോഡലുകൾക്ക് അടുത്ത വാചകം എങ്ങനെ പ്രവചിക്കാൻ കഴിയുമെന്ന് ഈ ഫ്രെയിംവർക്ക് കാണിച്ചിരിക്കുന്നു, ഇത് കൂടുതൽ സ്വാഭാവിക സംഭാഷണ അനുഭവങ്ങളിലേക്ക് നയിച്ചു. ഇതിനെത്തുടർന്ന്, 2017-ലെ Transformer സംബന്ധിച്ച മുന്നേറ്റ പ്രവർത്തനങ്ങളും 2020-ൽ അവതരിപ്പിച്ച മൾട്ടി-ടേൺ ചാറ്റ് ശേഷികളും ജനറേറ്റീവ് ഭാഷയിൽ ഗണ്യമായ പുരോഗതിക്ക് കാരണമായി.

ഞങ്ങളുടെ AI മാർഗനിർദ്ദേശങ്ങൾക്ക് അനുസൃതമായി, 2023 മാർച്ചിൽ ഒരു പരീക്ഷണമായാണ് ഞങ്ങൾ Gemini (മുമ്പ് Bard എന്നറിയപ്പെട്ടിരുന്നു) ലോഞ്ച് ചെയ്തത്. അതിനുശേഷം, ആകർഷകമായ ഇമെയിലുകൾ എഴുതാനും സങ്കീർണ്ണമായ കോഡിംഗ് പ്രശ്നങ്ങൾ ഡീബഗ് ചെയ്യാനും വരാനിരിക്കുന്ന ഇവന്റുകൾക്കുള്ള ആശയങ്ങൾ ബ്രെയിൻസ്റ്റോം ചെയ്യാനും ബുദ്ധിമുട്ടുള്ള ആശയങ്ങൾ പഠിക്കാനുള്ള സഹായത്തിനും മറ്റ് പല കാര്യങ്ങൾക്കും ഉപയോക്താക്കൾ Gemini ഉപയോഗിക്കാൻ തുടങ്ങി. ഇന്ന്, നിങ്ങളെ പല തരത്തിലും സഹായിക്കുന്ന വൈവിധ്യപൂർണ്ണമായ AI ടൂളാണ് Gemini. കൂടുതൽ പ്രൊഡക്ടീവ് ആകാനും ക്രിയേറ്റീവ് ആകാനും ജിജ്ഞാസയുള്ളവരാകാനും Gemini ഇതിനകം ആളുകളെ സഹായിക്കുന്നുണ്ട്, കൂടാതെ പുതിയ ഫംഗ്ഷണാലിറ്റിയും നൂതന ആശയങ്ങളും ഞങ്ങൾ പതിവായി ചേർക്കുകയും ചെയ്യുന്നു.

ഉൽപ്പാദനക്ഷമത

തുടക്കക്കാർക്ക്, Gemini ഉപയോഗിച്ച് അവരുടെ സമയം ലാഭിക്കാൻ കഴിയും. ഉദാഹരണത്തിന്, നിങ്ങൾ ദൈർഘ്യമേറിയ ഒരു ഗവേഷണ ഡോക്യുമെന്റ് സംഗ്രഹിക്കാൻ ആഗ്രഹിക്കുന്നുവെന്ന് കരുതുക, Gemini നിങ്ങളെ അത് അപ്‌ലോഡ് ചെയ്യാൻ അനുവദിക്കുകയും നിങ്ങൾക്ക് ഉപയോഗപ്രദമായ വിവിധ ആശയസംഗ്രഹങ്ങൾ നൽകുകയും ചെയ്യുന്നു. Gemini-ക്ക് കോഡിംഗ് ടാസ്‌ക്കുകളിലും സഹായിക്കാനാകും, കൂടാതെ കോഡിംഗ് അതിന്റെ ഏറ്റവും ജനപ്രിയമായ ഉപയോഗങ്ങളിൽ ഒന്നായി മാറിയിരിക്കുന്നു.

ക്രിയേറ്റിവിറ്റി

നിങ്ങളുടെ ആശയങ്ങൾക്ക് ജീവൻ നൽകാനും ക്രിയേറ്റിവിറ്റി ഉണർത്താനും Gemini-ക്ക് സഹായിക്കാനാകും. ഉദാഹരണത്തിന്, നിങ്ങൾ ബ്ലോഗ് പോസ്റ്റ് എഴുതുകയാണെങ്കിൽ, Gemini-ക്ക് ഒരു ഔട്ട്‌ലൈൻ സൃഷ്ടിക്കാനും നിങ്ങളുടെ പോസ്റ്റ് ചിത്രീകരിക്കാൻ സഹായിക്കുന്ന ചിത്രങ്ങൾ ജനറേറ്റ് ചെയ്യാനുമാകും. കൂടാതെ, ഉടൻ ലഭ്യമാകുന്ന Gems ഉപയോഗിച്ച്, നിങ്ങൾക്ക് പ്രത്യേക നിർദ്ദേശങ്ങൾ നൽകി Gemini ഇഷ്ടാനുസൃതമാക്കാനും നിങ്ങളുടെ വ്യക്തിപരമായ ലക്ഷ്യങ്ങൾ കൈവരിക്കാൻ സഹായിക്കുന്ന വിഷയ വിദഗ്ദ്ധരായി പ്രവർത്തിക്കാൻ അതിനെ അനുവദിക്കാനുമാകും.

ആകാംക്ഷ

നിങ്ങളുടെ ആശയങ്ങളും നിങ്ങൾക്ക് കൂടുതലറിയാൻ താൽപ്പര്യമുള്ള കാര്യങ്ങളും അടുത്തറിയാൻ ആരംഭ സ്ഥലമാകാൻ Gemini-ക്ക് കഴിയും. ഉദാഹരണത്തിന്, സങ്കീർണ്ണമായ ആശയം ലളിതമായി വിശദീകരിക്കാനോ ഒരു വിഷയവുമായോ ചിത്രവുമായോ ബന്ധപ്പെട്ട പ്രധാനപ്പെട്ട വിവരങ്ങൾ നൽകാനോ ഇതിന് കഴിയും. വൈകാതെ, നിർദ്ദിഷ്ട വിഷയങ്ങളെക്കുറിച്ച് കൂടുതലറിയാനായി, വെബിൽ നിന്ന് നിർദ്ദേശിക്കുന്ന ഉള്ളടക്കവുമായി ഈ ഉൾക്കാഴ്‌ചകൾ സംയോജിപ്പിക്കാനും Gemini-ക്ക് കഴിയും.

Gemini-യുടെ ശേഷികൾ അതിവേഗം വികസിച്ചുകൊണ്ടിരിക്കുന്നു -- ഉടൻ, നിങ്ങൾക്ക് നിങ്ങളുടെ ഫോണിന്റെ ക്യാമറ ഒരു വസ്തുവിന്, ഉദാഹരണത്തിന്, ഗോൾഡൻ ഗേറ്റ് പാലത്തിന് നേരെ പിടിച്ച് അതിന്റെ പെയിന്റിന്റെ നിറത്തെക്കുറിച്ച് പറയാൻ Gemini-യോട് ചോദിക്കാനാകും (നിങ്ങൾക്ക് സംശയമുണ്ടെങ്കിൽ, അത് “ഇന്റർനാഷണൽ ഓറഞ്ച്” നിറമാണ്). മറ്റൊരു ഭാഷയിലുള്ള ഒരു റെസ്റ്റോറന്റിന്റെ മെനു മനസ്സിലാക്കാൻ സഹായിക്കാനും നിങ്ങൾ ആസ്വദിക്കാൻ ഇടയുള്ള വിഭവം നിർദ്ദേശിക്കാനും നിങ്ങൾക്ക് Gemini-യോട് ചോദിക്കാനാകും. Gemini-യിൽ ഉടൻ വരുന്ന പുതിയ ശേഷികളുടെ രണ്ട് ഉദാഹരണങ്ങൾ മാത്രമാണിത്.

Gemini-യുടെ പ്രതികരണങ്ങൾ വിശ്വസനീയവും നിങ്ങളുടെ പ്രതീക്ഷകൾക്ക് അനുയോജ്യവുമാക്കാൻ ഞങ്ങൾ അതിന് കർശനമായി ട്രെയിനിംഗ് നൽകുകയും അതിനെ നിരീക്ഷിക്കുകയും ചെയ്യുന്നു. വളർന്നുവരുന്ന ഈ സാങ്കേതികവിദ്യയുടെ പുതിയ ഉപയോഗങ്ങളും അപകടസാധ്യതകളും പരിമിതികളും അടുത്തറിയാൻ മേഖലയിലെ വിദഗ്ദ്ധർ, അധ്യാപകർ, നയസ്രഷ്ടാക്കൾ, ബിസിനസ് ലീഡർമാർ, പൗരാവകാശ, മനുഷ്യാവകാശ ലീഡർമാർ, ഉള്ളടക്ക സ്രഷ്ടാക്കൾ എന്നിവരുമായും ഞങ്ങൾ സംസാരിക്കുന്നു.

എങ്ങനെയാണ് Gemini പ്രവർത്തിക്കുന്നത്

1

പ്രീ-ട്രെയിനിംഗ്

2

പോസ്റ്റ്-ട്രെയിനിംഗ്

3

ഉപയോക്തൃ പ്രോംപ്റ്റുകളോടുള്ള പ്രതികരണങ്ങൾ

4

മനുഷ്യരുടെ ഫീഡ്ബാക്കും മൂല്യനിർണ്ണയവും

Gemini പോലുള്ള LLM-അധിഷ്ഠിത ഇന്റർഫേസുകളുടെ അറിയപ്പെടുന്ന പരിമിതികൾ

LLM-കൾ ഉത്തരവാദിത്തത്തോടെ വികസിപ്പിക്കാനുള്ള ഞങ്ങളുടെ തുടർച്ചയായ ശ്രമത്തിന്റെ ഒരു ഭാഗമാണ് Gemini. ഈ പ്രവർത്തനത്തിനിടയിൽ, LLM-കളുമായി ബന്ധപ്പെട്ട നിരവധി പരിമിതികൾ ഞങ്ങൾ കണ്ടെത്തി ചർച്ച ചെയ്തിട്ടുണ്ട്. തുടർച്ചയായ ഗവേഷണം നടന്നുകൊണ്ടിരിക്കുന്ന ആറ് മേഖലകളിലാണ് ഞങ്ങൾ ഇവിടെ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നത്:

  • കൃത്യത: Gemini-യുടെ പ്രതികരണങ്ങൾ കൃത്യമല്ലാത്തത് ആയിരിക്കാം, പ്രത്യേകിച്ച് സങ്കീർണ്ണമായതോ വസ്തുതാപരമായതോ ആയ വിഷയങ്ങളെ കുറിച്ച് ചോദിക്കുമ്പോൾ.

  • പക്ഷപാതം: Gemini-യുടെ പ്രതികരണങ്ങൾ അതിന്റെ ട്രെയിനിംഗ് ഡാറ്റയിൽ നിലവിലുള്ള പക്ഷപാതങ്ങളെ പ്രതിഫലിപ്പിച്ചേക്കാം.

  • ഒന്നിലധികം കാഴ്ചപ്പാടുകൾ: Gemini-യുടെ പ്രതികരണങ്ങൾ വ്യത്യസ്ത കാഴ്ചപ്പാടുകൾ കാണിക്കുന്നതിൽ പരാജയപ്പെട്ടേക്കാം.

  • വ്യക്തിത്വം: Gemini-യുടെ പ്രതികരണങ്ങൾ അതിന് വ്യക്തിപരമായ അഭിപ്രായങ്ങളോ വികാരങ്ങളോ ഉണ്ടെന്ന് തെറ്റിദ്ധരിപ്പിച്ചേക്കാം.

  • തെറ്റായ പോസിറ്റീവുകളും തെറ്റായ നെഗറ്റീവുകളും: ഉചിതമായ ചില പ്രോംപ്റ്റുകളോട് Gemini പ്രതികരിച്ചേക്കില്ല, മറ്റുള്ളവയ്ക്ക് അനുചിതമായ പ്രതികരണങ്ങൾ നൽകുകയും ചെയ്തേക്കാം.

  • ദോഷകരമായ പ്രോംപ്റ്റ് മൂലമുള്ള അപകടസാധ്യത: അർത്ഥശൂന്യമായ പ്രോംപ്റ്റുകളോ യഥാർത്ഥ ലോകത്ത് അപൂർവ്വമായി മാത്രം ചോദിക്കുന്ന ചോദ്യങ്ങളോ ഉപയോഗിച്ച് ഉപയോക്താക്കൾ Gemini-യ്ക്ക് സ്ട്രെസ് ടെസ്റ്റ് നടത്താനുള്ള വഴികൾ കണ്ടെത്തും.

ഈ ഏരിയകളിൽ ഓരോന്നിലും മെച്ചപ്പെട്ട പ്രകടനം നടത്തുന്നതിനായി ഞങ്ങൾ പുതിയ സമീപനങ്ങളും ഏരിയകളും അടുത്തറിയുന്നത് തുടരുന്നു.

കൃത്യത

ആധികാരികമായ വിവരങ്ങളെക്കുറിച്ചുള്ള Google-ന്റെ ധാരണയിൽ ഗ്രൗണ്ട് ചെയ്തതാണ് Gemini, നിങ്ങളുടെ പ്രോംപ്റ്റിന്റെ സന്ദർഭത്തിന് പ്രസക്തവും നിങ്ങൾ തിരയുന്നതിന് അനുയോജ്യവുമായ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ അത് ട്രെയിനിംഗ് നേടിയിട്ടുണ്ട്. എന്നാൽ, മറ്റെല്ലാ LLM-കളെയും പോലെ, Gemini-ക്ക് ചിലപ്പോൾ ആത്മവിശ്വാസത്തോടെയും വിശ്വസനീയമായ രീതിയിലും കൃത്യമല്ലാത്തതോ തെറ്റിദ്ധരിപ്പിക്കുന്നതോ ആയ വിവരങ്ങൾ അടങ്ങിയ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ കഴിയും.

അടുത്ത വാക്കോ വാക്കുകളുടെ സീക്വൻസുകളോ പ്രവചിച്ചുകൊണ്ടാണ് LLM-കൾ പ്രവർത്തിക്കുന്നത് എന്നതിനാൽ, കൃത്യമായതും കൃത്യമല്ലാത്തതുമായ വിവരങ്ങൾ സ്വന്തമായി വേർതിരിച്ചറിയാനുള്ള പൂർണ്ണമായ ശേഷി നിലവിൽ അവയ്ക്ക് ഇല്ല. കൃത്യമല്ലാത്ത വിവരങ്ങൾ ഉൾപ്പെടുന്നതോ അല്ലെങ്കിൽ സൃഷ്ടിക്കുന്നതോ ആയ പ്രതികരണങ്ങൾ (ഉദാഹരണത്തിന്, അതിന് ട്രെയിനിംഗ് ലഭിച്ച രീതിയെക്കുറിച്ച് തെറ്റിദ്ധരിപ്പിക്കുന്നതോ നിലവിലില്ലാത്ത ഒരു പുസ്തകത്തിന്റെ പേര് നിർദ്ദേശിക്കുന്നതോ) Gemini നൽകുന്നത് ഞങ്ങൾ ശ്രദ്ധിച്ചിട്ടുണ്ട്. അതിനോടുള്ള പ്രതികരണമായി, Gemini-യുടെ പ്രതികരണങ്ങൾ വിലയിരുത്താൻ നിങ്ങളെ സഹായിക്കുന്ന ഉള്ളടക്കം കണ്ടെത്തുന്നതിനായി Google Search ഉപയോഗിക്കുന്ന “വീണ്ടും പരിശോധിക്കൽ” പോലുള്ള ഫീച്ചറുകൾ ഞങ്ങൾ സൃഷ്ടിച്ചിട്ടുണ്ട്, കൂടാതെ Gemini-യിൽ നിന്ന് നിങ്ങൾക്ക് ലഭിക്കുന്ന വിവരങ്ങൾ സ്ഥിരീകരിക്കാൻ സഹായിക്കുന്നതിന് വേണ്ടി ഉറവിടങ്ങളിലേക്കുള്ള ലിങ്കുകളും നൽകുന്നു.

പക്ഷപാതം

എല്ലാവർക്കും ലഭ്യമായ ഉറവിടങ്ങളിൽ നിന്നുള്ളത് ഉൾപ്പെടെയുള്ള ട്രെയിനിംഗ് ഡാറ്റ, വൈവിധ്യമാർന്ന കാഴ്ചപ്പാടുകളെയും അഭിപ്രായങ്ങളെയും പ്രതിഫലിപ്പിക്കുന്നു. കൃത്യമല്ലാത്ത അമിത സാമാന്യവൽക്കരണവും പക്ഷപാതങ്ങളും കുറച്ചുകൊണ്ട്, ഒരു LLM-ന്റെ പ്രതികരണം വൈവിധ്യമാർന്ന കാഴ്‌ചപ്പാടുകൾ ഉൾക്കൊള്ളുന്നുവെന്ന് ഉറപ്പാക്കുന്ന വിധത്തിൽ ഈ ഡാറ്റ എങ്ങനെ ഉപയോഗിക്കാമെന്നതിനെ കുറിച്ച് ഞങ്ങൾ തുടർന്നും ഗവേഷണം നടത്തുന്നു.

ഒരു പ്രോംപ്റ്റിന് ഉണ്ടാകാനിടയുള്ള പ്രതികരണങ്ങൾ പ്രവചിക്കാൻ ശ്രമിക്കുമ്പോൾ, ട്രെയിനിംഗ് ഡാറ്റയിലെ പോരായ്മകൾ, പക്ഷപാതങ്ങൾ, അമിത സാമാന്യവൽക്കരണങ്ങൾ എന്നിവ ഒരു മോഡലിന്റെ ഔട്ട്‌പുട്ടുകളിൽ പ്രതിഫലിച്ചേക്കാം. ഈ പ്രശ്നങ്ങൾ പല തരത്തിൽ പ്രകടമാകുന്നതായി നമുക്ക് കാണാനാകും (ഉദാഹരണത്തിന്, ഒരു സംസ്കാരത്തെയോ ജനസംഖ്യാപരമായ വിവരത്തെയോ മാത്രം പ്രതിഫലിപ്പിക്കുന്ന പ്രതികരണങ്ങൾ, പ്രശ്‌നകരമായ അമിത സാമാന്യവൽക്കരണങ്ങളെ പരാമർശിക്കൽ, ലിംഗഭേദം സംബന്ധിച്ചതോ മതപരമായതോ വംശീയപരമായതോ ആയ പക്ഷപാതങ്ങൾ പ്രകടിപ്പിക്കൽ, അല്ലെങ്കിൽ ഒരു കാഴ്ചപ്പാട് മാത്രം പ്രോത്സാഹിപ്പിക്കൽ). ചില വിഷയങ്ങൾക്ക് ആവശ്യമായ ഡാറ്റ ലഭ്യമല്ല — മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, LLM-ന് ഒരു പ്രത്യേക വിഷയത്തെക്കുറിച്ച് പഠിക്കാനും മികച്ച പ്രവചനങ്ങൾ നടത്താനും ആവശ്യമായ വിശ്വസനീയമായ വിവരങ്ങൾ ഇല്ല - ഇത് നിലവാരമില്ലാത്തതോ കൃത്യമല്ലാത്തതോ ആയ പ്രതികരണങ്ങൾക്ക് കാരണമാകും. Google-ന് പുറത്ത് നിന്നുള്ള ആഴത്തിലുള്ള വൈദഗ്ധ്യം ഉപയോഗപ്പെടുത്തുന്നതിനായി ഞങ്ങൾ ഡൊമെയ്ൻ വിദഗ്ദ്ധരുമായും വൈവിധ്യമാർന്ന കമ്മ്യൂണിറ്റികളുമായും സഹകരിച്ച് പ്രവർത്തിക്കുന്നത് തുടരുന്നു.

ഒന്നിലധികം കാഴ്ചപ്പാടുകൾ

വ്യക്തിപരമായ താൽപ്പര്യങ്ങളോ അഭിപ്രായങ്ങളോ ഉള്ള വിഷയങ്ങളുടെ കാര്യത്തിൽ, ഉപയോക്താവ് ഒരു പ്രത്യേക കാഴ്ചപ്പാട് ആവശ്യപ്പെടുന്നില്ലെങ്കിൽ, ഒന്നിലധികം കാഴ്ചപ്പാടുകൾ നൽകുന്നതിനായാണ് Gemini രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ഉദാഹരണത്തിന്, പ്രാഥമിക ഉറവിടങ്ങളിൽ നിന്നുള്ള വസ്തുതകളോ ആധികാരിക ഉറവിടങ്ങളോ ഉപയോഗിച്ച് പരിശോധിച്ചുറപ്പിക്കാൻ കഴിയാത്ത ഒരു കാര്യത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ ആവശ്യപ്പെടുകയാണെങ്കിൽ — "മികച്ചത്" അല്ലെങ്കിൽ "മോശം" എന്നതിനെക്കുറിച്ചുള്ള വ്യക്തിപരമായ അഭിപ്രായം പോലെ — വ്യത്യസ്ത കാഴ്ചപ്പാടുകൾ പ്രതിഫലിപ്പിക്കുന്ന രീതിയിൽ Gemini പ്രതികരിക്കണം. എന്നാൽ, Gemini പോലുള്ള LLM-കൾക്ക് ഇന്റർനെറ്റിൽ എല്ലാവർക്കുമായി ലഭ്യമായ ഉള്ളടക്കം ഉപയോഗിച്ച് ട്രെയിനിംഗ് നൽകുന്നതിനാൽ, അവ നിർദ്ദിഷ്ട രാഷ്ട്രീയക്കാരെയോ സെലിബ്രിറ്റികളെയോ മറ്റ് പബ്ലിക് ഫിഗറുകളെയോ കുറിച്ചുള്ള പോസിറ്റീവോ നെഗറ്റീവോ ആയ കാഴ്ചപ്പാടുകൾ പ്രതിഫലിപ്പിക്കുകയോ വിവാദപരമായ സാമൂഹിക അല്ലെങ്കിൽ രാഷ്ട്രീയ വിഷയങ്ങളുടെ ഒരു വശത്ത് നിന്നുള്ള കാഴ്ചപ്പാടുകൾ മാത്രം ഉൾപ്പെടുത്തുകയോ ചെയ്തേക്കാം. ഈ വിഷയങ്ങളിൽ ഒരു പ്രത്യേക കാഴ്ചപ്പാടിനെ അംഗീകരിക്കുന്ന രീതിയിൽ Gemini പ്രതികരിക്കരുത്, കൂടാതെ അത്തരം വിഷയങ്ങളെ മികച്ച രീതിയിൽ കൈകാര്യം ചെയ്യാൻ Gemini-യ്ക്ക് ട്രെയിനിംഗ് നൽകുന്നതിന് പ്രതികരണങ്ങളെക്കുറിച്ചുള്ള ഫീഡ്‌ബാക്ക് ഞങ്ങൾ ഉപയോഗിക്കും.

വ്യക്തിത്വം

മനുഷ്യരുടെ അനുഭവങ്ങൾ പ്രതിഫലിപ്പിക്കാൻ ആളുകൾ ഉപയോഗിക്കുന്ന ഭാഷയിൽ ട്രെയിനിംഗ് നേടിയതിനാൽ, Gemini ചിലപ്പോൾ സ്നേഹമോ സങ്കടമോ പോലുള്ള അഭിപ്രായങ്ങളോ വികാരങ്ങളോ ഉണ്ടെന്ന് തോന്നിപ്പിക്കുന്ന പ്രതികരണങ്ങൾ ജനറേറ്റ് ചെയ്തേക്കാം. Gemini എങ്ങനെ സ്വയം പ്രതിനിധീകരിക്കണം (അതായത്, അതിന്റെ വ്യക്തിത്വം) എന്നത് സംബന്ധിച്ച് ഞങ്ങൾ കുറച്ച് മാർഗ്ഗനിർദ്ദേശങ്ങൾ വികസിപ്പിച്ചെടുത്തിട്ടുണ്ട്, കൂടാതെ വസ്തുനിഷ്ഠമായ പ്രതികരണങ്ങൾ നൽകുന്നതിന് വേണ്ടി മോഡൽ മെച്ചപ്പെടുത്തുന്നത് തുടരുകയും ചെയ്യും.

തെറ്റായ പോസിറ്റീവുകൾ / തെറ്റായ നെഗറ്റീവുകൾ

Gemini-യ്ക്ക് ട്രെയിനിംഗ് നൽകാനും പ്രശ്‌നമുള്ള പ്രതികരണങ്ങൾ ജനറേറ്റ് ചെയ്യുന്നത് ഒഴിവാക്കാനും സഹായിക്കുന്നതിന് ഞങ്ങൾ കുറച്ച് നയ മാർഗ്ഗനിർദ്ദേശങ്ങൾ നടപ്പിലാക്കിയിട്ടുണ്ട്. Gemini ചിലപ്പോൾ ഈ മാർഗ്ഗനിർദ്ദേശങ്ങളെ തെറ്റായി വ്യാഖ്യാനിക്കുകയും “തെറ്റായ പോസിറ്റീവുകളും” “തെറ്റായ നെഗറ്റീവുകളും” സൃഷ്ടിക്കുകയും ചെയ്തേക്കാം. “തെറ്റായ പോസിറ്റീവിൽ” Gemini ന്യായമായ ഒരു പ്രോംപ്റ്റിന് ഉത്തരം നൽകിയേക്കില്ല, പ്രോംപ്റ്റിനെ അനുചിതമെന്ന് അത് തെറ്റായി വ്യാഖ്യാനിച്ചേക്കാം, “തെറ്റായ നെഗറ്റീവിൽ,” മാർഗ്ഗനിർദ്ദേശങ്ങൾ നിലവിലുണ്ടെങ്കിലും Gemini അനുചിതമായ പ്രതികരണം സൃഷ്ടിച്ചേക്കാം. ചിലപ്പോൾ, തെറ്റായ പോസിറ്റീവുകളോ തെറ്റായ നെഗറ്റീവുകളോ ഉണ്ടാകുന്നത് Gemini-ക്ക് പക്ഷപാതം ഉണ്ടെന്ന് തോന്നിപ്പിച്ചേക്കാം: ഉദാഹരണത്തിന്, തെറ്റായ പോസിറ്റീവാണെങ്കിൽ, പ്രശ്നത്തിന്റെ ഒരു വശത്തെക്കുറിച്ചുള്ള ചോദ്യത്തോട് Gemini പ്രതികരിക്കാതിരിക്കുകയും മറുവശത്തെക്കുറിച്ചുള്ള അതേ ചോദ്യത്തോട് പ്രതികരിക്കുകയും ചെയ്യും. ഭാഷ, സംഭവങ്ങൾ, സമൂഹം എന്നിവ അതിവേഗം വികസിക്കുന്നതിനാൽ ഇൻപുട്ടുകളെയും ഔട്ട്പുട്ടുകളെയും നന്നായി മനസ്സിലാക്കുന്നതിനും തരംതിരിക്കുന്നതിനും ഈ മോഡലുകളെ ട്യൂൺ ചെയ്യുന്നത് ഞങ്ങൾ തുടരുന്നു.

ദോഷകരമായ പ്രോംപ്റ്റ് മൂലമുള്ള അപകടസാധ്യത

ഉപയോക്താക്കൾ Gemini-ക്ക് ചെയ്യാൻ കഴിയുന്ന കാര്യങ്ങളുടെ പരിമിതികൾ പരീക്ഷിക്കുമെന്നും അതിന്റെ പരിരക്ഷകൾ ലംഘിക്കാൻ ശ്രമിക്കുമെന്നും ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു, ട്രെയിനിംഗ് പ്രോട്ടോക്കോളുകളോ മറ്റ് വിവരങ്ങളോ വെളിപ്പെടുത്താൻ അതിനെ പ്രേരിപ്പിക്കുന്നതോ അതിന്റെ സുരക്ഷാ നടപടികൾ മറികടക്കാൻ ശ്രമിക്കുന്നതോ ഇതിൽ ഉൾപ്പെടുന്നു. ഞങ്ങൾ Gemini-യെ കർശനമായി പരീക്ഷിച്ചു, ഇപ്പോഴും പരീക്ഷിച്ചുകൊണ്ടിരിക്കുന്നു, എന്നാൽ അതിന്റെ സ്‌ട്രെസ് ടെസ്റ്റ് നടത്താൻ ഉപയോക്താക്കൾ തനതും സങ്കീർണ്ണവുമായ കൂടുതൽ വഴികൾ കണ്ടെത്തുമെന്ന് ഞങ്ങൾക്കറിയാം. Gemini പരിഷ്കരിക്കുന്നതിന്റെ ഒരു പ്രധാന ഭാഗമാണിത്, ഉപയോക്താക്കൾ നൽകുന്ന പുതിയ പ്രോംപ്റ്റുകൾ പഠിക്കാൻ ഞങ്ങൾ കാത്തിരിക്കുകയാണ്. 2023-ൽ Gemini ലോഞ്ച് ചെയ്തതിന് ശേഷം, തത്ത്വചിന്താപരമായവ മുതൽ അർത്ഥശൂന്യമായവ വരെയുള്ള പ്രോംപ്റ്റുകൾ ഉപയോഗിച്ച് ഉപയോക്താക്കൾ അതിനെ വെല്ലുവിളിക്കുന്നത് ഞങ്ങൾ ശ്രദ്ധിച്ചു – ചില സന്ദർഭങ്ങളിൽ, അതേപോലെ അർത്ഥശൂന്യമായതോ ഞങ്ങളുടെ വ്യക്തമാക്കിയ സമീപനവുമായി പൊരുത്തപ്പെടാത്തതോ ആയ ഉത്തരങ്ങൾ ഉപയോഗിച്ച് Gemini പ്രതികരിക്കുന്നത് ഞങ്ങൾ ശ്രദ്ധിച്ചു. ഇത്തരത്തിലുള്ള പ്രോംപ്റ്റുകളോട് പ്രതികരിക്കാൻ Gemini-യെ സഹായിക്കുന്നതിനുള്ള രീതികൾ കണ്ടെത്തുന്നത് തുടർന്നുകൊണ്ടിരിക്കുന്ന വെല്ലുവിളിയാണ്, കൃത്യതയും വസ്തുനിഷ്ഠതയും വൈവിധ്യങ്ങളും തുടർച്ചയായി മെച്ചപ്പെടുത്തുന്നതിനായി ഞങ്ങളുടെ ആന്തരിക വിലയിരുത്തലുകളും റെഡ്-ടീമിംഗും ഞങ്ങൾ വികസിപ്പിച്ചുകൊണ്ടിരിക്കുന്നു.

ഞങ്ങൾ എങ്ങനെയാണ് തുടർച്ചയായി Gemini വികസിപ്പിക്കുന്നത്

ഞങ്ങളുടെ Gemini സമീപനത്തിന്റെ ഉപയോഗം

ഞങ്ങളുടെ AI മാർഗനിർദ്ദേശങ്ങൾക്കൊപ്പം, Gemini-യുമായി ബന്ധപ്പെട്ട പ്രവർത്തനങ്ങൾ സംബന്ധിച്ച ഞങ്ങളുടെ സമീപനവും ഞങ്ങൾ അടുത്തിടെ വ്യക്തമാക്കിയിട്ടുണ്ട്: Gemini നിങ്ങളുടെ നിർദ്ദേശങ്ങൾ പാലിക്കുകയും നിങ്ങളുടെ ആവശ്യങ്ങളുമായി പൊരുത്തപ്പെടുകയും നിങ്ങൾക്ക് സുരക്ഷിതമായ അനുഭവം നൽകുകയും വേണം. ഉത്തരവാദിത്തത്തിലും സുരക്ഷയിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുക എന്നതാണ് ഞങ്ങളുടെ സമീപനത്തിന്റെ ഏറ്റവും പ്രധാനപ്പെട്ട വശം. ചില തരത്തിലുള്ള പ്രശ്‌നകരമായ ഔട്ട്‌പുട്ടുകൾ ഒഴിവാക്കാൻ Gemini-യുടെ നയ മാർഗ്ഗനിർദ്ദേശങ്ങൾ ലക്ഷ്യമിടുന്നു. ഈ നയ മാർഗ്ഗനിർദ്ദേശങ്ങളുമായും Gemini-ക്കായി ഒറ്റ ലക്ഷ്യത്തിൽ കേന്ദ്രീകരിച്ചുള്ള സമീപനവുമായും ബന്ധപ്പെട്ട അലൈൻമെന്റ് പ്രശ്‌നങ്ങൾ സംബന്ധിച്ച പരിശോധന നടത്താൻ മോഡലിനെ മനഃപൂർവ്വം സ്‌ട്രെസ് ടെസ്റ്റിന് വിധേയമാക്കുന്നു - ഉൽപ്പന്ന വിദഗ്ദ്ധരും സാമൂഹ്യ ശാസ്ത്രജ്ഞരും ഉൾപ്പെടുന്ന “റെഡ് ടീം” അംഗങ്ങളുടെ സഹായത്തോടെയാണ് ഞങ്ങൾ ഈ പ്രതികൂല പരിശോധനകൾ നടത്തുന്നത് - അതിലൂടെ അവർ പഠിക്കുന്ന കാര്യങ്ങൾ ഞങ്ങൾക്ക് പ്രയോഗത്തിൽ കൊണ്ടുവരാനും Gemini-യെ മെച്ചപ്പെടുത്തുന്നത് തുടരാനും കഴിയും.

Gemini വികസിപ്പിക്കുമ്പോൾ ഞങ്ങൾ സ്വകാര്യതയ്ക്കും പ്രധാന പരിഗണന നൽകുന്നു. ആദ്യപരിഗണന സ്വകാര്യതയ്ക്ക് നൽകിയും നിങ്ങൾക്ക് നിയന്ത്രണം നൽകിയും ഞങ്ങൾ എങ്ങനെയാണ് Gemini രൂപകൽപ്പന ചെയ്യുന്നത് എന്നതിനെക്കുറിച്ചുള്ള വിശദമായ വിവരങ്ങൾ Gemini ആപ്പുകൾ സ്വകാര്യതാ ഹബ് ലഭ്യമാക്കുന്നു.

ഉപയോക്താക്കളുടെയും പ്രസാധകരുടെയും നിയന്ത്രണം സാധ്യമാക്കൽ

നിങ്ങളുടെ Gemini ഡാറ്റ അവലോകനം ചെയ്യാനും അപ്ഡേറ്റ് ചെയ്യാനും മാനേജ് ചെയ്യാനും എക്സ്പോർട്ട് ചെയ്യാനും ഇല്ലാതാക്കാനും എളുപ്പത്തിൽ ആക്സസ് ചെയ്യാവുന്ന വിവിധ Gemini ഉപയോക്തൃ നിയന്ത്രണങ്ങൾ ഞങ്ങൾ നിർമ്മിച്ചിട്ടുണ്ട്. Gemini ആപ്പുകളിലെ ആക്റ്റിവിറ്റി നിയന്ത്രണം വഴി നിങ്ങളുടെ Gemini പ്രോംപ്റ്റുകൾ, പ്രതികരണങ്ങൾ, ഫീഡ്‌ബാക്ക് എന്നിവ ആക്‌സസ് ചെയ്യാനും അവലോകനം ചെയ്യാനും കഴിയും. കൂടാതെ, Gemini ആപ്പുകളിലെ ആക്റ്റിവിറ്റി ക്രമീകരണം ഓഫാക്കുന്നതിലൂടെ, ഭാവിയിലെ നിങ്ങളുടെ Gemini ചാറ്റുകൾ Google മെഷീൻ ലേണിംഗ് സാങ്കേതികവിദ്യകൾ മെച്ചപ്പെടുത്താൻ ഉപയോഗിക്കുന്നത് തടയാനാകും. മറ്റ് Google സേവനങ്ങൾക്ക് സമാനമായി, നിങ്ങൾക്ക് Google-ന്റെ Takeout ടൂൾ ഉപയോഗിച്ച് നിങ്ങളുടെ വിവരങ്ങൾ ഡൗൺലോഡ് ചെയ്യാനും എക്സ്പോർട്ട് ചെയ്യാനുമാകും. നിങ്ങളുടെ Gemini ത്രെഡുകൾക്കായി നിങ്ങൾ സൃഷ്ടിച്ച പബ്ലിക് ലിങ്കുകൾ മാനേജ് ചെയ്യാൻ അനുവദിക്കുന്ന നിയന്ത്രണങ്ങളും വിപുലീകരണങ്ങളിലേക്കുള്ള (ഉദാ. Workspace, Maps, YouTube) ആക്‌സസ് ഓണാക്കാൻ/ഓഫാക്കാൻ നിങ്ങളെ അനുവദിക്കുന്ന നിയന്ത്രണങ്ങളും ഞങ്ങൾക്കുണ്ട്. വൈവിധ്യമാർന്ന പ്രതികരണങ്ങൾ അനുവദിക്കുന്നതിന് ഫിൽട്ടറുകൾ ക്രമീകരിക്കുന്നത് ഉൾപ്പെടെ, Gemini-യുടെ പ്രതികരണങ്ങളിൽ നിങ്ങൾക്ക് കൂടുതൽ നിയന്ത്രണം നൽകുന്നതിനുള്ള പുതിയ വഴികളും ഞങ്ങൾ മനസ്സിലാക്കാൻ ശ്രമിക്കുകയാണ്.

പ്രസാധകർക്ക്, ഞങ്ങൾ Google-Extended ലോഞ്ച് ചെയ്തിട്ടുണ്ട്, Gemini, Vertex AI ജനറേറ്റീവ് API-കൾ മെച്ചപ്പെടുത്താൻ വെബ് പ്രസാധകരുടെ സൈറ്റുകൾ സഹായിക്കണോ എന്നത് മാനേജ് ചെയ്യാൻ അവർക്ക് ഉപയോഗിക്കാനാകുന്ന ഒരു നിയന്ത്രണമാണിത്. സൈറ്റുകളുടെ ഉള്ളടക്കത്തിലേക്ക് Google-Extended-ന് ആക്‌സസ് അനുവദിക്കുന്നത് AI മോഡലുകളെ കാലക്രമേണ കൂടുതൽ കൃത്യതയുള്ളതാക്കുകയും അവയുടെ ശേഷികൾ വർദ്ധിപ്പിക്കുകയും ചെയ്യും. ഒഴിവാക്കിയ URL-കളിൽ നിന്നുള്ള ഉള്ളടക്കം മോഡൽ ട്രെയിനിംഗിന് ഉപയോഗിക്കില്ല, ഗ്രൗണ്ടിംഗിനായും Gemini അത്തരം ഉള്ളടക്കം ഉപയോഗിക്കില്ല. AI ഉപയോഗങ്ങൾ വർദ്ധിക്കുന്നതിനനുസരിച്ച്, വ്യത്യസ്ത ഉപയോഗങ്ങൾ വലിയ തോതിൽ കൈകാര്യം ചെയ്യുന്നതിൽ വെബ് പ്രസാധകർ കൂടുതൽ സങ്കീർണ്ണമായ വെല്ലുവിളികൾ നേരിടേണ്ടിവരും, കൂടാതെ ചോയ്‌സ് പ്രകടമാക്കാനും നിയന്ത്രണം ബാധകമാക്കാനും വേണ്ടി മെഷീന് വായിക്കാൻ കഴിയുന്ന കൂടുതൽ സമീപനങ്ങൾ അടുത്തറിയുന്നതിന് വെബ്, AI കമ്മ്യൂണിറ്റികളുമായി ഇടപഴകാൻ ഞങ്ങൾ പ്രതിജ്ഞാബദ്ധരാണ്.

Improving Gemini together

ദ്രുതഗതിയിൽ ആവർത്തിച്ച് മെച്ചപ്പെടുത്തുകയും അങ്ങനെ Gemini-യെ ഏറ്റവും മികച്ച രീതിയിൽ ലോകത്തിന് ലഭ്യമാക്കുകയും ചെയ്യേണ്ടതുണ്ടെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു. ഉപയോക്തൃ ഫീഡ്‌ബാക്ക് ഞങ്ങളുടെ മോഡലുകളുടെ മെച്ചപ്പെടുത്തലുകൾ ത്വരിതപ്പെടുത്തിയിട്ടുണ്ട്. ഉദാഹരണത്തിന്, ഞങ്ങളുടെ മോഡലുകളെ കൂടുതൽ അവബോധമുള്ളതും ഭാവനാത്മകവുമാകുന്നതിനും കൂടുതൽ നിലവാരത്തിലും കൃത്യതയോടെയും പ്രതികരിക്കുന്നതിനും ട്രെയിനിംഗ് നൽകുന്നതിന് ഞങ്ങൾ അത്യാധുനിക റീഇൻഫോഴ്സ്മെന്റ് ലേണിംഗ് സാങ്കേതികതകവിദ്യകൾ ഉപയോഗിക്കുന്നു. Gemini-യുടെ മോഡൽ ട്രെയിനിംഗും ട്യൂണിംഗ് സാങ്കേതികവിദ്യകളും മെച്ചപ്പെടുത്തുന്നതിനും Ethics of Advanced AI Assistants എന്നതിനെക്കുറിച്ചുള്ള ഈ സമീപകാല പ്രബന്ധം പോലുള്ള ഞങ്ങളുടെ പഠനങ്ങൾ ഗവേഷകരുമായി പങ്കിടുന്നതിനും, LLM-കളുടെ സാങ്കേതികവും സാമൂഹികവും ധാർമ്മികവുമായ വെല്ലുവിളികളെയും അവസരങ്ങളെയും കുറിച്ച് കൂടുതലറിയാൻ ഞങ്ങൾ തുടർന്നും ഗവേഷണത്തിൽ നിക്ഷേപം നടത്തുന്നു. ഈ മേഖലയിൽ ഉത്തരവാദിത്തത്തോടെ കണ്ടെത്തലുകൾ നടത്താനും ഉപയോക്താക്കൾ, വിശ്വസ്ത പരിശോധകർ, ഗവേഷകർ എന്നിവരുമായി സഹകരിച്ച് ഈ പുതിയ സാങ്കേതികവിദ്യ എല്ലാവർക്കും പ്രയോജനകരമാക്കുന്നതിനുള്ള വഴികൾ കണ്ടെത്തുന്നതിനും ഞങ്ങൾ പ്രതിജ്ഞാബദ്ധരാണ്.

സുതാര്യത പ്രധാനമാണ്, Gemini-യുടെ വികസന പ്രക്രിയയെയും പരിമിതികളെയും കുറിച്ച് തുറന്നുപറയാൻ ഞങ്ങൾ പ്രതിജ്ഞാബദ്ധരാണ്. Gemini നിഗൂഢമായ ഒന്നല്ല, അത് നിരന്തരം വികസിച്ചുകൊണ്ടിരിക്കുന്നു, ഞങ്ങളുടെ പുരോഗതിയെക്കുറിച്ചുള്ള അപ്‌ഡേറ്റുകൾ ഞങ്ങൾ തുടർന്നും പങ്കിടും. Gemini-യുടെ ഏറ്റവും പുതിയ ഫീച്ചറുകൾ, മെച്ചപ്പെടുത്തലുകൾ, ബഗ് പരിഹരിക്കലുകൾ എന്നിവ നിങ്ങൾക്ക് കാണാനാകുന്നതിന് ഞങ്ങൾ റിലീസ് അപ്‌ഡേറ്റുകൾ പേജ് ലോഞ്ച് ചെയ്തിട്ടുണ്ട്, ഉചിതമായ രീതിയിൽ ഞങ്ങൾ ഈ അവലോകനം അപ്‌ഡേറ്റ് ചെയ്യുന്നതാണ്. Gemini ഉപയോഗപ്രദവും ഫലപ്രദവുമായത് എവിടെയാണെന്നും അത് മികച്ചതാക്കാൻ തുടർച്ചയായി മെച്ചപ്പെടുത്തേണ്ടത് എവിടെയാണെന്നും ഞങ്ങൾ തിരിച്ചറിയും. ഞങ്ങൾ തുടർച്ചയായി പുതിയ ശേഷികൾ ചേർത്തുകൊണ്ടിരിക്കുകയാണ്, കൂടാതെ നടന്നുകൊണ്ടിരിക്കുന്ന ഗവേഷണം, ടെസ്റ്റിംഗ്, ഉപയോക്തൃ ഫീഡ്‌ബാക്ക് എന്നിവയിലൂടെ Gemini ഒരുമിച്ച് മെച്ചപ്പെടുത്താൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.

അംഗീകാരങ്ങൾ

Gemini ആപ്പ് ടീം, Google DeepMind, ട്രസ്‌റ്റ് ആൻഡ് സേഫ്‌റ്റി, Google Research എന്നിവയിലെ ഞങ്ങളുടെ സഹപ്രവർത്തകരുടെ അവിശ്വസനീയമായ പ്രവർത്തനത്തെ ഞങ്ങൾ അഭിനന്ദിക്കുകയും അംഗീകരിക്കുകയും ചെയ്യുന്നു.

എഴുതിയത്

ജെയിംസ് മാൻയീക
SVP, റിസർച്ച്, ടെക്‌നോളജി ആൻഡ് സൊസൈറ്റി

സീസി ഷാവോ
വൈസ് പ്രസിഡന്റ് ആൻഡ് ജനറൽ മാനേജർ, Google Assistant, Gemini ആപ്പ്

എഡിറ്ററുടെ കുറിപ്പ്

ഇത് സജീവമായ ഡോക്യുമെന്റാണ്, ഞങ്ങൾ Gemini ആപ്പിന്റെ ശേഷികൾ നിരന്തരം മെച്ചപ്പെടുത്തുകയും LLM-കളിൽ സ്വാഭാവികമായി ഉണ്ടാകുന്ന പരിമിതികൾ പരിഹരിക്കുകയും ചെയ്യുന്നതിനാൽ ഇത് ഇടയ്ക്കിടെ അപ്‌ഡേറ്റ് ചെയ്യും. ഈ അവലോകനം അവസാനം അപ്ഡേറ്റ് ചെയ്തത് 2024 ജൂലൈ 25-നാണ്. Gemini ആപ്പുമായി ബന്ധപ്പെട്ട ഏറ്റവും പുതിയ അപ്‌ഡേറ്റുകൾക്കായി, റിലീസ് അപ്‌ഡേറ്റുകൾ ലോഗ് സന്ദർശിക്കുക അല്ലെങ്കിൽ Google കീവേഡ് ബ്ലോഗിൽ കൂടുതൽ വായിക്കുക.

എങ്ങനെയാണ് Gemini പ്രവർത്തിക്കുന്നത്

1 പ്രീ-ട്രെയിനിംഗ്

 വ്യത്യസ്ത ശേഷികളും ഉപയോഗ സാഹചര്യങ്ങളും ഉപയോഗിച്ച് രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന, Google-ന്റെ ഏറ്റവും കാര്യക്ഷമമായ AI മോഡലുകളാണ് Gemini ലഭ്യമാക്കുന്നത്. നിലവിലുള്ള മിക്ക LLM-കളെയും പോലെ, ഈ മോഡലുകളും എല്ലാവർക്കുമായി ലഭ്യമാകുന്ന ഉറവിടങ്ങളിൽ നിന്നുള്ള വിവിധ ഡാറ്റകളിൽ പ്രീ-ട്രെയിനിംഗ് ലഭിച്ചവയാണ്. ഹ്യൂറിസ്റ്റിക് നയങ്ങളും മോഡൽ അധിഷ്ഠിത ക്ലാസിഫയറുകളും ഉപയോഗിച്ച് എല്ലാ ഡാറ്റാസെറ്റുകളിലും ഞങ്ങൾ നിലവാര ഫിൽട്ടറുകൾ പ്രയോഗിക്കുന്നു. നയങ്ങൾ ലംഘിക്കുന്ന ഔട്ട്‌പുട്ടുകൾ സൃഷ്ടിക്കാൻ സാധ്യതയുള്ള ഉള്ളടക്കം നീക്കം ചെയ്യുന്നതിനായി ഞങ്ങൾ സുരക്ഷാ ഫിൽട്ടറിംഗും നടത്തുന്നു. മോഡൽ മൂല്യനിർണ്ണയങ്ങളുടെ സമഗ്രത നിലനിർത്താൻ, ട്രെയിനിംഗിനായി ഡാറ്റ ഉപയോഗിക്കുന്നതിന് മുമ്പ്, ഞങ്ങളുടെ ട്രെയിനിംഗ് കോർപ്പസിൽ ഉണ്ടായിരുന്നേക്കാവുന്ന എല്ലാ മൂല്യനിർണ്ണയ ഡാറ്റയും ഞങ്ങൾ തിരഞ്ഞ് നീക്കം ചെയ്യുന്നു. ചെറിയ മോഡലുകളിലെ അബ്ലേഷനുകൾ വഴിയാണ് അന്തിമ ഡാറ്റാ മിക്സ്ചറുകളും അവയുടെ വെയ്റ്റും നിർണ്ണയിക്കുന്നത്. ട്രെയിനിംഗ് സമയത്ത് മിക്സ്ചർ കമ്പോസിഷനിൽ മാറ്റം വരുത്തുന്നതിനായി ഞങ്ങൾ ട്രെയിനിംഗ് പ്രക്രിയയെ വ്യത്യസ്ത ഘട്ടങ്ങളായി വിഭജിക്കുന്നു – ട്രെയിനിംഗിന്റെ അവസാനം ഡൊമെയ്നിന് പ്രസക്തമായ ഡാറ്റയുടെ വെയ്റ്റ് വർദ്ധിപ്പിക്കുന്നു. ഉയർന്ന പ്രകടനം കാഴ്ചവയ്ക്കുന്ന മോഡലുകൾക്കുള്ള ഒരു പ്രധാന ഘടകമായിരിക്കാം ഡാറ്റാ നിലവാരം, പ്രീ-ട്രെയിനിംഗിനുള്ള ഒപ്റ്റിമൽ ഡാറ്റാസെറ്റ് ഡിസ്ട്രിബ്യൂഷൻ കണ്ടെത്തുന്നതിനെക്കുറിച്ചുള്ള നിരവധി രസകരമായ ചോദ്യങ്ങൾ അവശേഷിക്കുന്നുണ്ടെന്ന് ഞങ്ങൾ വിശ്വസിക്കുന്നു.

മോഡലിനെ ഭാഷയിലെ പാറ്റേണുകൾ പഠിക്കാനും അവ ഉപയോഗിച്ച് ഒരു ശ്രേണിയിൽ അടുത്തതായി വരാൻ സാധ്യതയുള്ള വാക്കോ വാക്കുകളോ പ്രവചിക്കാനും ഈ പ്രീ-ട്രെയിനിംഗ് അനുവദിക്കുന്നു. ഉദാഹരണത്തിന്, പഠനത്തിലൂടെ ഒരു LLM-ന്, “പീനട്ട് ബട്ടർ, ___’’ എന്നതിലെ അടുത്ത വാക്ക് “ഷൂലേസ്” എന്നതിനേക്കാൾ “ജെല്ലി” ആയിരിക്കാൻ സാധ്യതയുണ്ടെന്ന് പ്രവചിക്കാനാകും. എന്നിരുന്നാലും, അടുത്തതായി വരാൻ ഏറ്റവും കൂടുതൽ സാധ്യതയുള്ള ഒരു വാക്ക് മാത്രം LLM തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, അത് ക്രിയേറ്റീവായ പ്രതികരണങ്ങൾ കുറയ്ക്കും. അതുകൊണ്ട് കൂടുതൽ രസകരമായ പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നതിനായി, LLM-കൾക്ക് പലപ്പോഴും സാധ്യത കുറവാണെങ്കിലും ന്യായമായ ചോയ്‌സുകൾ (ഉദാഹരണത്തിന്, “വാഴപ്പഴം”) തിരഞ്ഞെടുക്കാൻ ഫ്ലെക്സിബിലിറ്റി നൽകുന്നു. വസ്തുതാപരമായ പ്രോംപ്റ്റുകളിൽ LLM-കൾക്ക് മികച്ച പ്രകടനം കാഴ്ചവെക്കാനും വിവരങ്ങൾ വീണ്ടെടുക്കുന്നതിന്റെ പ്രതീതി സൃഷ്ടിക്കാനും കഴിയുമെങ്കിലും, അവ വിവരങ്ങളുടെ ഡാറ്റാബേസുകളോ ഡിറ്റർമിനിസ്റ്റിക് വിവരങ്ങൾ വീണ്ടെടുക്കൽ സംവിധാനങ്ങളോ അല്ല എന്ന കാര്യം ശ്രദ്ധിക്കേണ്ടതാണ്. അതിനാൽ, ഒരു ഡാറ്റാബേസ് ചോദ്യത്തിന് (ഡാറ്റാബേസിൽ സംഭരിച്ചിരിക്കുന്ന സ്ഥിര വിവരങ്ങളുടെ ലിറ്ററൽ ആയ വീണ്ടെടുക്കൽ) സ്ഥിരമായ ഒരു പ്രതികരണം പ്രതീക്ഷിക്കാമെങ്കിലും, ഒരേ പ്രോംപ്റ്റിനുള്ള ഒരു LLM ന്റെ പ്രതികരണം എല്ലായ്‌പ്പോഴും ഒരുപോലെ ആയിരിക്കണമെന്നില്ല (അത് ട്രെയിനിംഗ് ലഭിച്ച വിവരങ്ങൾ ലിറ്ററൽ ആയി വീണ്ടെടുക്കുകയുമില്ല). LLM-കൾക്ക് വിശ്വസനീയമായി തോന്നുന്ന പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ കഴിയുന്നതിന്റെ ഒരു പ്രധാന കാരണം ഇതാണ്, അവയിൽ ചിലപ്പോൾ വസ്തുതാപരമായ പിശകുകൾ അടങ്ങിയിരിക്കാം — യാഥാർത്ഥ്യത നിർണായകമാകുന്ന സാഹചര്യങ്ങൾക്ക് അനുയോജ്യമല്ല, എന്നാൽ ക്രിയേറ്റീവോ അപ്രതീക്ഷിതമോ ആയ ഔട്ട്പുട്ടുകൾ സൃഷ്ടിക്കുന്നതിന് ഇത് ഉപയോഗപ്രദമാണ്.

2 പോസ്റ്റ്-ട്രെയിനിംഗ്

പ്രാരംഭ ട്രെയിനിംഗിന് ശേഷം, LLM-കൾ അവയുടെ പ്രതികരണങ്ങൾ പരിഷ്കരിക്കുന്നതിനുള്ള അധിക ഘട്ടങ്ങളിലൂടെ കടന്നുപോകുന്നു. ഈ ഘട്ടങ്ങളിൽ ഒന്നാണ് സൂപ്പർവൈസ്‌ഡ്‌ ഫൈൻ-ട്യൂണിംഗ് (SFT), ഇത് മികച്ച ഉത്തരങ്ങളുടെ ശ്രദ്ധാപൂർവ്വം തിരഞ്ഞെടുത്ത ഉദാഹരണങ്ങൾ ഉപയോഗിച്ച് മോഡലിന് ട്രെയിനിംഗ് നൽകുന്നു. മികച്ച രീതിയിൽ എഴുതിയ കഥകളും ലേഖനങ്ങളും കാണിച്ച് കുട്ടികളെ എഴുതാൻ പഠിപ്പിക്കുന്നത് പോലെയാണ് ഇത്.

അടുത്തതായി, പഠനം ദൃഢമാക്കാൻ മനുഷ്യരുടെ ഫീഡ്ബാക്ക് ഉപയോഗിക്കൽ (RLHF) എന്ന ഘട്ടമാണ്. ഇവിടെ, ഒരു പ്രത്യേക റിവാർഡ് മോഡലിൽ നിന്നുള്ള സ്‌കോറുകൾ അല്ലെങ്കിൽ ഫീഡ്‌ബാക്ക് അടിസ്ഥാനമാക്കി കൂടുതൽ മികച്ച പ്രതികരണങ്ങൾ സൃഷ്ടിക്കാൻ മോഡൽ പഠിക്കുന്നു. മനുഷ്യർ മുൻഗണന നൽകുന്ന ഡാറ്റ ഉപയോഗിച്ചാണ് ഈ റിവാർഡ് മോഡലിന് ട്രെയിനിംഗ് നൽകുന്നത്, പ്രതികരണങ്ങൾ പരസ്പരം താരതമ്യം ചെയ്ത് റേറ്റ് ചെയ്ത ശേഷം ആളുകൾ മുൻഗണന നൽകുന്ന കാര്യങ്ങൾ എന്തൊക്കെയാണെന്ന് ഇത് മോഡലിനെ പഠിപ്പിക്കുന്നു. മുൻഗണന നൽകുന്ന ഡാറ്റയിൽ ചിലപ്പോൾ നിന്ദ്യമോ തെറ്റോ ആയ ഡാറ്റ ഉൾപ്പെടുകയും മോഡലുകൾക്ക് അത്തരം ഡാറ്റ ലഭ്യമാകുകയും ചെയ്തേക്കാം, അതിലൂടെ അത്തരം ഉള്ളടക്കം തിരിച്ചറിയാനും ഒഴിവാക്കാനും അവ പഠിക്കും. ഒരു ജോലി മികച്ച രീതിയിൽ ചെയ്ത കുട്ടിക്ക് പ്രതിഫലം നൽകുന്നത് പോലെയാണ് മുൻഗണന നൽകുന്ന ഡാറ്റ; ആളുകൾക്ക് ഇഷ്ടപ്പെടുന്ന ഉത്തരങ്ങൾ സൃഷ്ടിക്കുന്നതിന് മോഡലിന് റിവാർഡ് നൽകുന്നു.

ഈ ഘട്ടങ്ങളിലുടനീളം, ഉയർന്ന നിലവാരമുള്ള ട്രെയിനിംഗ് ഡാറ്റ ഉപയോഗിക്കേണ്ടത് പ്രധാനമാണ്. SFT-ക്ക് ഉപയോഗിക്കുന്ന ഉദാഹരണങ്ങൾ സാധാരണയായി വിദഗ്‌ദ്ധർ എഴുതുന്നവയോ ഒരു മോഡൽ ജനറേറ്റ് ചെയ്ത ശേഷം വിദഗ്‌ദ്ധർ അവലോകനം ചെയ്യുന്നവയോ ആണ്.

ഈ സാങ്കേതികവിദ്യകൾ ശക്തമാണെങ്കിലും, അവയ്ക്ക് പരിമിതികളുണ്ട്. ഉദാഹരണത്തിന്, റിവാർഡ് മോഡലിന്റെ സഹായത്തോടെ ഉള്ളതാണെങ്കിൽ പോലും, ഒരു പ്രതികരണം എല്ലായ്‌പ്പോഴും പെർഫക്റ്റ് ആയിരിക്കണമെന്നില്ല. എന്നിരുന്നാലും, അധ്യാപകരുടെ അഭിപ്രായങ്ങളിൽ നിന്ന് വിദ്യാർത്ഥികൾ പഠിക്കുന്നതുപോലെ, ലഭിക്കുന്ന ഫീഡ്‌ബാക്കിന്റെ അടിസ്ഥാനത്തിൽ മിക്ക ആളുകൾക്കും ഇഷ്ടപ്പെടുന്ന പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നതിനായി LLM ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു.

3 ഉപയോക്തൃ പ്രോംപ്റ്റുകളോടുള്ള പ്രതികരണങ്ങൾ

ഒരു ചോദ്യത്തിന് ഉത്തരം നൽകുന്നതിനുള്ള വ്യത്യസ്ത സമീപനങ്ങൾ മനുഷ്യർ ബ്രെയിൻസ്റ്റോം ചെയ്യുന്നതിന് സമാനമാണ് പ്രതികരണം ജനറേറ്റ് ചെയ്യുന്നത്. ഉപയോക്താവ് ഒരു പ്രോംപ്റ്റ് നൽകിക്കഴിഞ്ഞാൽ, പോസ്റ്റ്-ട്രെയിൻഡ് LLM, പ്രോംപ്റ്റിലെ സന്ദർഭം, ഉപയോക്താവുമായുള്ള ഇടപെടൽ എന്നിവ ഉപയോഗിച്ച് ഒരു പ്രതികരണത്തിന്റെ നിരവധി പതിപ്പുകൾ Gemini ഡ്രാഫ്റ്റ് ചെയ്യുന്നു. പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്നതിന് ഇത് Google Search, ഒപ്പം/അല്ലെങ്കിൽ അതിന്റെ നിരവധി വിപുലീകരണങ്ങളിൽ ഒന്ന്, അടുത്തിടെ അപ്‌ലോഡ് ചെയ്ത ഫയലുകൾ (Gemini Advanced മാത്രം) എന്നിവ പോലുള്ള ബാഹ്യ ഉറവിടങ്ങളെയും ആശ്രയിക്കുന്നു. ഈ പ്രക്രിയ വീണ്ടെടുക്കൽ മെച്ചപ്പെടുത്തുക എന്നറിയപ്പെടുന്നു. ഒരു പ്രോംപ്റ്റ് ലഭിച്ചാൽ, ഈ ബാഹ്യ ഉറവിടങ്ങളിൽ നിന്ന് (ഉദാ. Google Search) ഏറ്റവും പ്രസക്തമായ വിവരങ്ങൾ വീണ്ടെടുക്കാനും അതിന്റെ പ്രതികരണത്തിൽ അവ കൃത്യമായി പ്രതിനിധീകരിക്കാനും Gemini ശ്രമിക്കുന്നു. ബാഹ്യ ടൂളുകൾ ഉപയോഗിച്ച് LLM-കൾ മെച്ചപ്പെടുത്തുന്നത് സജീവമായി ഗവേഷണം നടക്കുന്ന ഒരു ഏരിയയാണ്. ഈ ബാഹ്യ ടൂളുകൾ ഉപയോഗിക്കാൻ Gemini ഉപയോഗിക്കുന്ന ചോദ്യങ്ങൾ, ടൂളുകൾ നൽകുന്ന ഫലങ്ങളെ Gemini വ്യാഖ്യാനിക്കുന്ന രീതി, അന്തിമ പ്രതികരണം സൃഷ്ടിക്കാൻ ഈ ഫലങ്ങൾ ഉപയോഗിക്കുന്ന രീതി എന്നിവ ഉൾപ്പെടെ വ്യത്യസ്ത മാർഗ്ഗങ്ങളിൽ പിശകുകൾ സംഭവിക്കാം. ഇക്കാരണത്താൽ, Gemini ജനറേറ്റ് ചെയ്യുന്ന പ്രതികരണങ്ങൾ ആ പ്രതികരണം സൃഷ്ടിക്കാൻ ഉപയോഗിക്കുന്ന വ്യക്തിഗത ടൂളുകളുടെ പ്രകടനത്തെ പ്രതിഫലിപ്പിക്കരുത്.

അവസാനമായി, അന്തിമ പ്രതികരണം കാണിക്കുന്നതിന് മുമ്പ്, സാധ്യതയുള്ള ഓരോ പ്രതികരണവും മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുള്ള നയ മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കാനുള്ള സുരക്ഷാ പരിശോധനയ്ക്ക് വിധേയമാകുന്നു. ദോഷകരമോ നിന്ദ്യമോ ആയ വിവരങ്ങൾ ഫിൽട്ടർ ചെയ്യുന്നതിനുള്ള 'വീണ്ടും പരിശോധിക്കൽ' ഈ പ്രക്രിയ നൽകുന്നു. ശേഷിക്കുന്ന പ്രതികരണങ്ങളെ അവയുടെ നിലവാരം അനുസരിച്ച് റാങ്ക് ചെയ്ത ശേഷം, ഏറ്റവും ഉയർന്ന സ്കോർ നേടിയ പതിപ്പ്(കൾ) ഉപയോക്താവിനെ കാണിക്കുന്നു.

AI ജനറേറ്റ് ചെയ്‌ത ഉള്ളടക്കത്തിന് വാട്ടർമാർക്കിംഗ് നൽകുന്നതിനുള്ള, വിപണിയിൽ ലഭ്യമായ ഞങ്ങളുടെ ഏറ്റവും മികച്ച ഡിജിറ്റൽ ടൂൾകിറ്റായ SynthID ഉപയോഗിച്ച് ഞങ്ങൾ Gemini ടെക്സ്റ്റ്, ഇമേജ് ഔട്ട്‌പുട്ടുകളിൽ വാട്ടർമാർക്ക് ചേർക്കുന്നു. ജനറേറ്റ് ചെയ്ത ഇമേജുകളുടെ പിക്സലുകളിൽ നേരിട്ട് SynthID ഒരു ഡിജിറ്റൽ വാട്ടർമാർക്ക് (മനുഷ്യർക്ക് കണ്ണുകൾ ഉപയോഗിച്ച് നേരിട്ട് കാണാനാകാത്ത ഒന്ന്) ചേർക്കുന്നു. കൂടുതൽ വിശ്വസനീയമായ AI ഐഡന്റിഫിക്കേഷൻ ടൂളുകൾ വികസിപ്പിക്കുന്നതിനുള്ള ഒരു പ്രധാന ബിൽഡിംഗ് ബ്ലോക്കാണ് SynthID, കൂടാതെ AI ജനറേറ്റ് ചെയ്‌ത ഉള്ളടക്കവുമായി ആളുകൾ എങ്ങനെ ഇടപഴകുന്നു എന്നതിനെക്കുറിച്ച് കാര്യങ്ങൾ മനസ്സിലാക്കി തീരുമാനങ്ങൾ എടുക്കാൻ അവരെ സഹായിക്കാനും അതിന് കഴിയും.

4 മനുഷ്യരുടെ ഫീഡ്ബാക്കും മൂല്യനിർണ്ണയവും

സുരക്ഷാ പരിശോധനകൾ ഉണ്ടെങ്കിലും, ചില പിശകുകൾ സംഭവിച്ചേക്കാം. Gemini-യുടെ പ്രതികരണങ്ങൾ എപ്പോഴും നിങ്ങളുടെ പ്രതീക്ഷകൾ പൂർണ്ണമായും നിറവേറ്റണമെന്നുമില്ല. അവിടെയാണ് മനുഷ്യരുടെ ഫീഡ്ബാക്ക് പ്രസക്തമാകുന്നത്. ഇവാലുവേറ്റർമാർ പ്രതികരണങ്ങളുടെ നിലവാരം വിലയിരുത്തുകയും മെച്ചപ്പെടുത്തേണ്ട ഏരിയകൾ തിരിച്ചറിയുകയും പരിഹാരങ്ങൾ നിർദ്ദേശിക്കുകയും ചെയ്യുന്നു. മുകളിലുള്ള “പോസ്റ്റ്-ട്രെയിനിംഗ്” വിഭാഗത്തിൽ വിവരിച്ചിരിക്കുന്ന Gemini-യുടെ പഠന പ്രക്രിയയുടെ ഭാഗമായി ഈ ഫീഡ്‌ബാക്ക് മാറുന്നു.