"ലോകത്തിലെ ഏറ്റവും മിടുക്കനായ" ഗ്രോക്ക് 3 പരിശോധിക്കുന്നു

ഐപു വാട്ടൺ ഗ്രൂപ്പ് (1)

പരിചയപ്പെടുത്തല്

മുൻകൂട്ടി പരിശീലനം ലഭിച്ച മോഡലുകളുടെ "എൻഡ്പോയിന്റ്" ആയിരിക്കുമെന്ന് നിങ്ങൾ കരുതുന്നുണ്ടോ?

ഒരു ലൈവ്സ്ട്രീമിലെ ഗ്രോക്ക്, ഗ്രോക് 3 എന്നീ ഏറ്റവും പുതിയ പതിപ്പ് എലോൺ കസ്കിനും സായ് ടീം official ദ്യോഗികമായി ആരംഭിച്ചു. ഈ ഇവന്റിന് മുമ്പ്, കസംഖ്യയുടെ 24/7 പ്രമോഷണൽ ഹൈപ്പറുമായി കൂടിച്ചേരുന്നതിന് മുമ്പ്, ഗ്രോക് 3-ന് ആഗോള പ്രതീക്ഷകൾ അഭൂതപൂർവമായ അളവിലേക്ക് ഉയർത്തി. ഒരാഴ്ച മുമ്പ്, ഡീപ്സൈക് ആർ 1 നെക്കുറിച്ച് അഭിപ്രായമിട്ട സമയത്ത് കസ്തൂരി ആത്മവിശ്വാസത്തോടെ പ്രസ്താവിച്ചു, "XAI ഒരു മികച്ച AI മോഡൽ സമാരംഭിക്കും." അവതരിപ്പിച്ച ഡാറ്റയിൽ നിന്ന് ഗണിതശാസ്ത്രത്തിന്റെ മാർസ് ദൗത്യങ്ങളുമായി ബന്ധപ്പെട്ട കമ്പ്യൂട്ടേഷണൽ മോഡലിംഗുകളെയും ഗ്യാങ്മാതകളുമായി ബന്ധപ്പെട്ട എല്ലാ മുഖ്യധാര മോഡലിംഗും ഗ്രെക്താൽ ഉപയോഗിച്ചുവെന്ന് പോലീസ് പറഞ്ഞു. എന്നിരുന്നാലും, ഇവ നിലവിൽ മസ്കെയുടെ വാദങ്ങൾ മാത്രമാണ്. സമാരംഭിച്ചതിനുശേഷം, ഞാൻ ഗ്രോക് 3 ന്റെ ഏറ്റവും പുതിയ ബീറ്റ പതിപ്പ് പരീക്ഷിച്ചു, ഇത് വലിയ മോഡലുകൾക്കായി ക്ലാസിക് ട്രിക്ക് ചോദ്യം ഉയർന്നു: "അത് വലുതാണ്, 9.11 അല്ലെങ്കിൽ 9.9?" ഖേദകരമെന്നു പറയട്ടെ, ഒരു ക്വാളിഫയറുകളും അടയാളങ്ങളും ഇല്ലാതെ, മിടുക്കനായ ഗ്രോക് 3 എന്ന് വിളിക്കപ്പെടുന്നത് ഈ ചോദ്യത്തിന് ശരിയായി ഉത്തരം നൽകാൻ കഴിഞ്ഞില്ല. ചോദ്യത്തിന്റെ അർത്ഥം കൃത്യമായി തിരിച്ചറിയുന്നതിൽ grok3 പരാജയപ്പെട്ടു.

 

ഈ പരീക്ഷണം പല സുഹൃത്തുക്കളിൽ നിന്നും വേഗത്തിൽ ശ്രദ്ധ ആകർഷിച്ചു, യാദൃശ്ചികമായി, വിദേശത്ത്, വിദേശകാര്യ പരിശോധനകൾ അടിസ്ഥാന ഭൗതികശാസ്ത്ര / ഗണിതശാസ്ത്രപരമായ ചോദ്യങ്ങൾ കാണിച്ചിരിക്കുന്നു "പിസയിലെ ചായയിൽ ആദ്യമായി ഏത് പന്ത്?" അങ്ങനെ, "ലളിതമായ ചോദ്യങ്ങൾക്ക് ഉത്തരം നൽകാൻ തയ്യാറാകാനുള്ള ഒരു പ്രതിഭ" എന്ന് സ്വയം ലേബൽ ചെയ്തിട്ടുണ്ട്.

640

ഗ്രോക് 3 നല്ലതാണ്, പക്ഷേ ഇത് r1 അല്ലെങ്കിൽ O1-പ്രോയേക്കാൾ മികച്ചതല്ല.

പ്രായോഗികമായി പൊതുവായ പല വിജ്ഞാന പരിശോധനകളിലും ഗ്രോക് 3 "പരാജയങ്ങൾ" അനുഭവിച്ചു. എക്സ്എയ് ലോഞ്ച് ഇവന്റിൽ, പ്രതീക ക്ലാസുകൾ വിശകലനം ചെയ്യുന്നതിനും പ്രവാസ ക്ലാസുകളുടെ ഗെയിം പാതയിലെ ഫലങ്ങൾ വിശകലനം ചെയ്യുന്നതിനും പ്രവാസികളുടെ ഗെയിം പാതയിൽ നിന്ന് വിശകലനം ചെയ്യുന്നതിനും ഗ്രോക് 3 ഉപയോഗിച്ച കംപ്സ് കന്നുകാലികളുടെ സമയത്ത് കസ്തൂരി ഈ വ്യക്തമായ പ്രശ്നം ശ്രദ്ധിച്ചില്ല.

 

ഗെയിമിംഗിൽ "പകരക്കാരനെ" കണ്ടെത്തുന്നതിന് കൂടുതൽ തെളിവുകൾ മാത്രമല്ല, പ്രായോഗിക ആപ്ലിക്കേഷനുകളിൽ ഗ്രോക്ക് 3 ന്റെ വിശ്വാസ്യതയെക്കുറിച്ച് ഗണ്യമായ ആശങ്കകൾ ഉയർത്തുന്നതിനും കൂടുതൽ തെളിവുകൾ മാത്രമേ നൽകിയിട്ടുള്ളൂ. അത്തരമൊരു "പ്രതിഭയ്ക്കായി," യഥാർത്ഥ കഴിവുകൾ പരിഗണിക്കാതെ, മാർസ് പര്യവേക്ഷണ ജോലികൾ പോലുള്ള അങ്ങേയറ്റം സങ്കീർണ്ണമായ ആപ്ലിക്കേഷൻ സാഹചര്യങ്ങളിലെ വിശ്വാസ്യത സംശയത്തിലാണ്.

 

നിലവിൽ, ഗ്രോക്ക് 3 ആഴ്ചകൾക്ക് മുമ്പ് പ്രവേശനം ലഭിച്ച നിരവധി ടെസ്റ്ററുകൾ, ഇന്നലെ ഏതാനും മണിക്കൂറുകൾക്ക് മോഡൽ കഴിവുകൾ പരീക്ഷിച്ചവർ എല്ലാം ഒരു സാധാരണ നിഗമനത്തിലാണ്: "100 അല്ലെങ്കിൽ O1-പ്രോയേക്കാൾ മികച്ചതല്ല."

640 (1)

"എൻവിഡിയയെ തടസ്സപ്പെടുത്തുക" എന്നതിലെ നിർണായക കാഴ്ചപ്പാട്

മോചനത്തിനിടയിൽ, മോചനത്തിനിടെ official ദ്യോഗികമായി പിമ്പിൽ ചാറ്റ് ബോട്ട് അരീനയിൽ "മുന്നോട്ട്" എന്ന് കാണിച്ചു, പക്ഷേ ഇത് ബുദ്ധിപൂർവ്വം ഗ്രാഫിലെ ലീഡർബലിലെ ലീഡർ അച്ചുതണ്ട് കാണിച്ചു, ഈ അവതരണത്തിൽ യഥാർത്ഥ 1% വ്യത്യാസമുണ്ടാക്കുന്നു.

640

യഥാർത്ഥ മോഡൽ സ്കോറിംഗ് ഫലങ്ങളിൽ, ഗ്രെക്സീക്ക് ആർ 1, ജിപിടി -40 എന്നിവയ്ക്ക് 1-2% മുന്നിലാണ്, ഇത് "ശ്രദ്ധേയമല്ലാത്ത വ്യത്യാസമില്ല" എന്ന പ്രായോഗിക പരിശോധനകളിലേക്ക് യോജിക്കുന്നു. ഗ്രോക് 3 അതിന്റെ പിൻഗാമികളെ 1% -2% കവിയുന്നു.

640

നിലവിൽ പൊതുവായി പരീക്ഷിച്ച എല്ലാ മോഡലുകളേക്കാളും ഗ്രോക് 3 സ്കോർ ചെയ്തിട്ടുണ്ടെങ്കിലും പലരും ഇത് ഗൗരവമായി കാണുന്നില്ല: എല്ലാത്തിനുമുപരി, 100 കാലഘട്ടത്തിലെ "കൃത്രിമത്വം" എന്ന് XAI മുമ്പ് വിമർശിച്ചു. ലീഡർ ഡെയ്ൻ ഉത്തരവിളയുടെ രേഖാമൂലമുള്ളതിനാൽ, സ്കോറുകൾ വളരെയധികം കുറഞ്ഞു, പ്രമുഖ വ്യവസായ സ്ഥാപകർ പലപ്പോഴും "ഉയർന്ന സ്കോറിംഗ് എന്നാൽ കുറഞ്ഞ കഴിവിനെ വിമർശിക്കുന്നു" എന്ന് നിലനിൽക്കുന്നു.

 

ലീഡർബോർഡ് "കൃത്രിമത്വം" അല്ലെങ്കിൽ ചിത്രീകരണങ്ങളിൽ രൂപകൽപ്പന ചെയ്തിരിച്ചാലും, മോഡൽ കഴിവുകളിൽ "പായ്ക്ക് നയിക്കുന്ന" ധാരണയിൽ xai, കസ്തൂരിയുടെ ആസക്തി എന്നിവയാണ് അവർ വെളിപ്പെടുത്തുന്നത്. കസ്തൂരി കുത്തനെയുള്ള വില നൽകി: ലോഞ്ച് സമയത്ത്, ലൈവ്സ്രീം സമയത്ത് 200,000 എച്ച് 100 ജിപിയുകൾ ഉപയോഗിച്ചതിനെക്കുറിച്ചും 200 ദശലക്ഷം സമയത്തെ പരിശീലന സമയം നേടുന്നതിനെക്കുറിച്ചും അദ്ദേഹം പ്രശംസിച്ചു. ഇത് ജിപിയു വ്യവസായത്തിന് മറ്റൊരു സുപ്രധാന ബൂണുകളെ പ്രതിനിധീകരിക്കുന്നതിനും ഈ മേഖലയിലെ ആഴത്തിലുള്ള സ്വാധീനം "വിഡ് ish ിത്തം" പരിഗണിക്കുന്നതിനും ഇത് കാരണമായി. ചിലർ വിശ്വസിക്കുന്നത്, ചിലർ വിശ്വസിക്കുന്നു, മാതൃകാ പരിശീലനത്തിന്റെ ഭാവി ആയിരിക്കും.

 

എന്നിരുന്നാലും, ചില നെറ്റിസൻമാർ രണ്ട് മാസത്തിൽ 2000 എച്ച് 800 ജിപിയുകൾ ഉപഭോഗത്തെ അപേക്ഷിച്ച്. 1402 പോയിന്റ് നേടി, ഗ്രോക് 3, 100 പോയിന്റിൽ താഴെയുള്ള ഡെപ്സീക്ക് വി 3 എന്നിവ തമ്മിലുള്ള വിടവ്. ഈ ഡാറ്റയുടെ പ്രകാശനത്തെത്തുടർന്ന്, ഗ്രോക് 3 ന്റെ ശീർഷകത്തിന് പിന്നിൽ "ലോകത്തിലെ ഏറ്റവും ശക്തമായ" എന്ന നിലയിൽ "ലോകത്തിലെ ഏറ്റവും ശക്തമായ" എന്ന നിലയിൽ, ശക്തമായ പ്രകടനം സൃഷ്ടിക്കുന്നത് വലിയ മോഡലുകളുടെ യുക്തി കുറയുന്നു.

640 (2)

"ഉയർന്ന സ്കോറിംഗ് എന്നാൽ കുറഞ്ഞ കഴിവുമുണ്ടെങ്കിൽ," ഗ്രോക് 2 ന് എക്സ് (ട്വിറ്റർ) പ്ലാറ്റ്ഫോമിൽ നിന്ന് ഉയർന്ന നിലവാരമുള്ള ആദ്യ-പാർട്ടി ഡാറ്റ ഉണ്ടായിരുന്നു. എന്നിരുന്നാലും, ഗ്രോക് 3-യുടെ പരിശീലനത്തിൽ, ഓപ്പേയ് നിലവിൽ, പ്രീമിയം പരിശീലന ഡാറ്റയുടെ അഭാവം മോഡലിന്റെ കഴിവുകളുടെ അരികിലെ യൂട്ടിലിറ്റി വേഗത്തിൽ തുറന്നുകാട്ടുന്നു.

 

ഈ വസ്തുതകൾ വളരെയധികം മനസിലാക്കാനും തിരിച്ചറിയാനും ഗ്രോക് 3, കസ്കിന്റെ ഡവലപ്പർമാർ ആദ്യം മനസിലാക്കാൻ സാധ്യതയുണ്ട്, ഇത് ഇപ്പോൾ സോഷ്യൽ മീഡിയയിൽ പരാമർശിക്കപ്പെടുന്നു, "ഇപ്പോഴും ബീറ്റ" ആണ്, "വരും മാസങ്ങളിൽ പൂർണ്ണ പതിപ്പ് റിലീസ് ചെയ്യും." അഭിപ്രായ വിഭാഗത്തിൽ നേരിട്ടുള്ള വിവിധ പ്രശ്നങ്ങളെക്കുറിച്ച് ഉപയോക്താക്കൾക്ക് ഫീഡ്ബാക്ക് നൽകുന്നതിന് ഗ്രോക് 3 ന്റെ ഉൽപ്പന്ന മാനേജരുടെ വേഷത്തിൽ കസ്താൻ നിർദ്ദേശിച്ചു. ഭൂമിയിലെ ഏറ്റവും കൂടുതൽ പിരിച്ചുവിട്ടയാകാം അദ്ദേഹം.

 

എന്നിട്ടും, ഒരു ദിവസം, ശക്തമായ വലിയ മോഡലുകളെ ആശ്രയിക്കാൻ പ്രതീക്ഷിക്കുന്നവർ "വമ്പൻ കണക്കുകൂട്ടലേഷൻ പേശിയെ" ആശ്രയിക്കാൻ ആഗ്രഹിക്കുന്നവർക്കായി അലാറങ്ങൾ ഉയർത്തി, ഓപ്പറേയിയുടെ ജിപിടി -4 ന് 1.8 ട്രില്യൺ ഡോളർ വലുപ്പം, പത്ത് ഇരട്ടകൾ. ജിപിടി -15 ന്റെ പാരാമീറ്റർ വലുപ്പം പോലും വലുതായിരിക്കാമെന്ന് അഭ്യൂഹങ്ങൾ സൂചിപ്പിക്കുന്നു.

 

മോഡൽ പാരാമീറ്റർ വലുപ്പമെന്ന നിലയിൽ, പരിശീലനച്ചെലവും പരിശീലനച്ചെലവ്. ഗ്രോക് 3 ന്റെ സാന്നിധ്യം, ജിപിടി -15 തുടങ്ങിയ മത്സരാർത്ഥികൾ, പാരാമീറ്റർ വലുപ്പത്തിലൂടെ മെച്ചപ്പെട്ട മോഡൽ പ്രകടനം തുടരാൻ ആഗ്രഹിക്കുന്ന മറ്റുള്ളവർ ഇപ്പോൾ കാഴ്ചയിൽ വ്യക്തമായി കാണും, അതിനെ എങ്ങനെ മറികടക്കുമെന്ന് ആലോചിക്കണം. ഈ നിമിഷം, ഓപ്പൺയ്യിലെ മുൻ ചീഫ് ശാസ്ത്രജ്ഞനായ ഇളി സബ്സ്കിർ, മുമ്പ് പ്രസ്താവിച്ചിരുന്നു, "ഞങ്ങൾക്ക് പരിചിതമായ പ്രീ-പരിശീലനം അവസാനിക്കും," വലിയ മോഡലുകളെ പരിശീലിപ്പിക്കുന്നതിനുള്ള ശ്രമങ്ങൾ.

640 (3)

ഇളിയുടെ വ്യവസായി വ്യവസായത്തിൽ അലാറം മുഴക്കി. ആക്സസ് ചെയ്യാവുന്ന പുതിയ ഡാറ്റയുടെ ആസന്നമായ ക്ഷീണം അദ്ദേഹം കൃത്യമായി മുൻകൂട്ടി കണ്ടു, ഡാറ്റ ഏറ്റെടുക്കലിലൂടെ പ്രകടനത്തിന് തുടരാൻ കഴിയാത്ത സാഹചര്യത്തിലേക്ക് നയിക്കാൻ കഴിയില്ല, ഇത് ഫോസിൽ ഇന്ധനങ്ങളുടെ ക്ഷീണത്തിലേക്ക് ഇഷ്ടപ്പെടുന്നു. "ഇൻറർനെറ്റിലെ മാനുഷിക സൃഷ്ടിച്ച ഉള്ളടക്കം ഒരു പരിമിതമായ വിഭവമാണെന്ന് അദ്ദേഹം സൂചിപ്പിച്ചു." സോറ്റ്സ്കീവിന്റെ പ്രവചനങ്ങളിൽ, അടുത്ത തലമുറ, പോസ്റ്റ്-പ്രീ-ഇൻവെസ്റ്റുകൾ, മനുഷ്യ മസ്തിഷ്കത്തിന് സമാനമായ "യഥാർത്ഥ സ്വയംഭരണം", യുക്തിസഹമായ ശേഷി "എന്നിവ കൈവശം വയ്ക്കും."

 

ഇന്നത്തെ പരിശീലനം ലഭിച്ച മോഡലുകളിൽ നിന്ന് വ്യത്യസ്തമായി (മുമ്പ് പഠിച്ച മോഡൽ ഉള്ളടക്കത്തെ അടിസ്ഥാനമാക്കി), ഭാവിയിലെ എഐ സിസ്റ്റങ്ങൾക്ക് മനുഷ്യന്റെ തലച്ചോറിന്റെ "ചിന്ത" എന്ന രീതിയിൽ പ്രശ്നങ്ങൾ പരിഹരിക്കാൻ പഠിക്കാനും സ്ഥാപിക്കാനും കഴിയും. ഒരു മനുഷ്യന് അടിസ്ഥാന പ്രൊഫഷണൽ സാഹിത്യത്തിൽ ഒരു വിഷയത്തിൽ മൗലിക വൈദഗ്ദ്ധ്യം നേടാൻ കഴിയും, അതേസമയം ഒരു ഐ വലിയ മോഡലിന് ഏറ്റവും അടിസ്ഥാന എൻട്രി ലെവൽ എഫൈസി നേടുന്നതിന് ഒരു വലിയ മോഡലിന് ദശലക്ഷക്കണക്കിന് ഡാറ്റ പോയിന്റുകൾ ആവശ്യമാണ്. വാക്ക് ചെറുതായി മാറിയപ്പോഴും, ഈ അടിസ്ഥാന ചോദ്യങ്ങൾ ശരിയായി മനസിലാക്കിയേക്കില്ല, ഓർഡൽ വിവേകത്തിൽ യഥാർത്ഥത്തിൽ മെച്ചപ്പെടുത്തിയിട്ടില്ല. ലേഖനത്തിന്റെ തുടക്കത്തിൽ പരാമർശിച്ചിരിക്കുന്ന അടിസ്ഥാനപരമായ ചോദ്യങ്ങൾ ഈ പ്രതിഭാസത്തിന്റെ വ്യക്തമായ ഉദാഹരണത്തെ പ്രതിനിധീകരിക്കുന്നു.

微信图片 _20240614024031.jpg1

തീരുമാനം

എന്നിരുന്നാലും, ക്രൂരമായ ബലപ്രയോഗത്തിനപ്പുറം, വ്യവസായത്തെ "മുൻകൂട്ടി പരിശീലനം നേടിയ മോഡലുകൾ അവസാനിക്കുന്നു," ഇത് ഫീൽഡിന് കാര്യമായ പ്രത്യാഘാതങ്ങൾ വഹിക്കും.

ഒരുപക്ഷേ അരികിലുള്ള ഗ്രോക്ക് 3 ക്രമേണ കുറയുകയും, "ഒരു നിർദ്ദിഷ്ട ഡാറ്റാസെറ്റിൽ സമർത്ഥമായ മോഡലുകൾ പോലെ," ആത്യന്തികമായി agi യുടെ യഥാർത്ഥ പാത്ത് കണ്ടെത്തുന്നതിന്റെ ഉദാഹരണം ഞങ്ങൾ സാക്ഷ്യം വഹിക്കും.

എൽവി കേബിൾ പരിഹാരം കണ്ടെത്തുക

കബിളുകൾ നിയന്ത്രിക്കുക

ബിഎംഎസ്, ബസ്, ഇൻഡസ്ട്രിയൽ, ഇൻസ്ട്രുമെന്റേഷൻ കേബിൾ.

ഘടനാപരമായ കേബിളിംഗ് സിസ്റ്റം

നെറ്റ്വർക്ക് & ഡാറ്റ, ഫൈബർ-ഒപ്റ്റിക് കേബിൾ, പാച്ച് കോഡ്, മൊഡ്യൂളുകൾ, ഫെയ്സ്പ്ലേറ്റ്

2024 എക്സിബിഷനുകളും ഇവന്റുകളും അവലോകനം

ഏപ്രിൽ 116 മുതൽ 18, ദുബായിലെ മിഡിൽ-ർജ്ജം

ഏപ്രിൽ 116 മുതൽ 18, 2024 മോസ്കോയിൽ സെക്യൂരിക്ക

മെയ് 9, 2024 പുതിയ ഉൽപ്പന്നങ്ങളും സാങ്കേതികവിദ്യകളും ഷാങ്ഹായിയിൽ ഇവന്റിലേക്ക് സമാരംഭിക്കുന്നു

224, 2024 സെക്യൂരിറ്റി ചൈന ബീജിംഗിൽ

നവംബർ 12-20, 2024 കണക്റ്റുചെയ്ത ലോകം കെഎസ്എ


പോസ്റ്റ് സമയം: ഫെബ്രുവരി -19-2025