Skip to content

ChatGPT ले नयाँ प्रकारको AI रेस सुरु गर्‍यो — र पाठ बाकसहरूलाई फेरि शान्त बनायो


यो धेरै स्पष्ट छ कि कसैले ChatGPT आउँदै गरेको देखेन। OpenAI पनि छैन। यो इतिहासको सबैभन्दा छिटो बढ्दो उपभोक्ता एप बन्नु अघि, यसले “उत्पादक पूर्व-प्रशिक्षित ट्रान्सफर्मर” वाक्यांशलाई सामान्य स्थानीय भाषामा परिणत गर्नु अघि, प्रत्येक कम्पनीले यसको अन्तर्निहित मोडेल अपनाउने दौडको बारेमा सोच्न सक्नु अघि, ChatGPT नोभेम्बरमा सुरु भयो। एक “अनुसन्धान पूर्वावलोकन।”

ChatGPT घोषणा गर्दै ब्लग पोस्ट अब underselling मा एक प्रफुल्लित केस अध्ययन हो। “ChatGPT InstructGPT को एक भाइबहिनी मोडेल हो, जसलाई प्रम्प्टमा निर्देशन पालना गर्न र विस्तृत प्रतिक्रिया प्रदान गर्न प्रशिक्षित गरिन्छ। हामी प्रयोगकर्ताहरूको प्रतिक्रिया प्राप्त गर्न र यसको बल र कमजोरीहरू बारे जान्नको लागि ChatGPT परिचय गर्न उत्साहित छौं।” यति हो! त्यो पूरै पिच हो! टेक्नोलोजीसँगको हाम्रो अन्तरक्रियाको प्रकृतिलाई मौलिक रूपमा परिवर्तन गर्ने बारे कुनै waxing काव्यात्मक छैन, यो कत्तिको चिसो छ भन्ने बारे एक रेखा पनि होइन। यो केवल एक अनुसन्धान पूर्वावलोकन थियो।

तर अब, चार महिना पछि, यस्तो देखिन्छ कि ChatGPT ले टेक्नोलोजीको बारेमा हामीले सोच्ने तरिकालाई परिवर्तन गर्न गइरहेको छ। वा, अझ सही रूपमा, यसलाई फेरि परिवर्तन गर्नुहोस्। किनभने हामी जसरी जाँदैछौं, टेक्नोलोजीको भविष्य whiz-bang इन्टरफेस वा metaverse होइन। यो “तपाईँको कम्प्युटरमा पाठ बाकसमा आदेशहरू टाइप गर्नुहोस्।” कमाण्ड लाइन फिर्ता आएको छ – यो अब एकदम धेरै स्मार्ट छ।

वास्तवमा, जेनेरेटिभ एआई दुई एकै साथ दिशामा जान्छ। तपाईंले पहिले नै प्रयोग गर्नुभएका सामानहरूमा नयाँ उपकरणहरू र क्षमताहरू थप्दै पहिलो धेरै पूर्वाधार हो। GPT-4 र Google को LaMDA जस्ता ठूला भाषा मोडेलहरूले तपाईंलाई इमेल र मेमोहरू लेख्न मद्दत गर्न गइरहेका छन्; तिनीहरूले स्वचालित रूपमा तपाइँको स्लाइड डेकहरू सजाउन जाँदैछन् र तपाइँको स्प्रेडसिटहरूमा कुनै पनि गल्तीहरू सच्याउनेछन्; तिनीहरूले तपाईं भन्दा राम्रो आफ्नो फोटो सम्पादन गर्न जाँदैछन्; तिनीहरूले तपाईंलाई कोड लेख्न मद्दत गर्न जाँदैछन् र धेरै अवस्थामा यो तपाईंको लागि मात्र गर्छ।

याद गर्नुहोस् जब सबैजना, पिज्जा हटले पनि च्याटबट गर्दै थिए?

यो लगभग एआई वर्षौंदेखि चलिरहेको बाटो हो, हैन? गुगलले विगत केही वर्षदेखि आफ्ना उत्पादनहरूमा सबै प्रकारका AI एकीकृत गर्दै आएको छ, र Salesforce जस्ता कम्पनीहरूले पनि बलियो AI अनुसन्धान परियोजनाहरू निर्माण गरेका छन्। यी मोडेलहरू सिर्जना गर्न महँगो, प्रशिक्षित गर्न महँगो, क्वेरी गर्न महँगो, र कर्पोरेट उत्पादकताको लागि सम्भावित रूपमा खेल परिवर्तन गर्ने। तपाईंले पहिल्यै प्रयोग गरिरहनुभएको उत्पादनहरूमा AI संवर्द्धनहरू एउटा ठूलो व्यवसाय हो — वा, कम्तिमा पनि त्यसैमा लगानी भइरहेको छ — र लामो समयसम्म रहनेछ।

अर्को AI दिशा, जहाँ AI सँग अन्तरक्रिया गर्दा उपभोक्ता उत्पादन बन्छ, धेरै कम स्पष्ट विकास थियो। यो अब अर्थपूर्ण छ, अवश्य: को गर्दैन चलचित्र र रेसिपीहरू र टोकियोमा के गर्ने भन्ने बारे सबै जान्ने रोबोटसँग कुरा गर्न चाहनुहुन्छ, र यदि मैले सही चीजहरू रेलबाट पूर्ण रूपमा बाहिर जान सक्छ र तपाईंसँग कुरा गर्ने प्रयास गर्न सक्छु भने? तर ChatGPT ले संसारलाई आँधीबेहरीमा लिनु अघि, र Bing र Bard दुबैले यो विचार लिनु अघि र यसबाट आफ्नै उत्पादनहरू निर्माण गर्ने प्रयास गर्नु अघि, म पक्कै पनि च्याट विन्डोमा टाइप गर्ने प्रयोगकर्ताको अर्को ठूलो कुरा हुनेछ भन्ने शर्त राख्दिन। इन्टरफेसहरू।

एक हिसाबले, यो धेरै पुरानो विचारमा फर्किने कुरा हो

एक हिसाबले, यो धेरै पुरानो विचारमा फर्किने कुरा हो। धेरै वर्षको लागि, धेरै प्रयोगकर्ताहरू मात्र खाली स्क्रिनमा टाइप गरेर कम्प्यूटरसँग अन्तर्क्रिया गर्‍यो — कमाण्ड लाइन तपाईंले मेसिनलाई के गर्ने भनेर बताउनुभएको थियो। (हो, ChatGPT एक हो धेरै मेसिनहरूको, र तिनीहरू त्यहाँ तपाईंको डेस्कमा छैनन्, तर तपाईंले विचार पाउनुहुन्छ।)

तर त्यसपछि, एउटा हास्यास्पद कुरा भयो: हामीले राम्रो इन्टरफेसहरू आविष्कार गर्यौं! कमाण्ड लाइनको साथ समस्या यो थियो कि तपाइँलाई के टाइप गर्ने र कुन क्रममा कम्प्यूटरलाई व्यवहार गर्नको लागि ठ्याक्कै जान्न आवश्यक थियो। ठूला आइकनहरूमा पोइन्ट गर्ने र क्लिक गर्न धेरै सरल थियो, साथै कम्प्युटरले चित्र र आइकनहरू मार्फत के गर्न सक्छ भनेर मानिसहरूलाई सिकाउन धेरै सजिलो थियो। आदेश रेखाले ग्राफिकल प्रयोगकर्ता इन्टरफेसलाई बाटो दियो, र GUI अझै पनि सर्वोच्च शासन गर्दछ।

यद्यपि, विकासकर्ताहरूले च्याट UI काम गर्न प्रयास गर्न कहिल्यै छोडेनन्। व्हाट्सएप एक राम्रो उदाहरण हो: कम्पनीले वर्षौं खर्च गरेको छ पत्ता लगाउन प्रयास गर्दै कसरी प्रयोगकर्ताहरूले व्यापारसँग अन्तरक्रिया गर्न च्याट प्रयोग गर्न सक्छन्। Allo, Google को धेरै असफल सन्देश अनुप्रयोगहरू मध्ये एक, आशा छ कि तपाईंले आफ्ना साथीहरूसँग च्याटहरू भित्र एआई सहायकसँग अन्तरक्रिया गर्न सक्नुहुन्छ। द च्याटबोट हाइपको पहिलो चरणलगभग 2016 को बारेमा, धेरै थियो धेरै स्मार्ट मान्छे सोच्दै मेसेजिङ एपहरू थिए भविष्य सबै कुराको।

त्यहाँ मेसेजिङ इन्टरफेस, “वार्तालाप एआई” को बारे मा केहि आकर्षक छ। यो तथ्यबाट सुरु हुन्छ कि हामी सबैलाई यसलाई कसरी प्रयोग गर्ने भनेर थाहा छ; मेसेजिङ एपहरू हामीले सबैभन्दा बढी ख्याल गर्ने मानिसहरूसँग कसरी सम्पर्कमा रहन्छौं भन्ने कुरा हो, जसको मतलब तिनीहरू हामीले धेरै समय र ऊर्जा खर्च गर्ने ठाउँ हुन्। तपाईंलाई Uber एपको रिसेसेसहरू कसरी नेभिगेट गर्ने वा साउथवेस्ट एपमा आफ्नो फ्रिक्वेन्ट फ्लायर नम्बर कसरी फेला पार्ने भन्ने थाहा नहुन सक्छ, तर “यी शब्दहरूलाई यो नम्बरमा टेक्स्ट गर्नुहोस्” भनेको प्राय सबैले बुझेको व्यवहार हो। एउटा बजारमा जहाँ मानिसहरू एपहरू डाउनलोड गर्न चाहँदैनन् र मोबाइल वेबसाइटहरू प्रायः अझै पनि चूस्छन्, सन्देशले अनुभवहरूलाई ठूलो तरिकामा सरल बनाउन सक्छ।

Bing (र सबैजना) ले च्याट इन्टरफेस लिइरहेको छ र यसको साथ चलिरहेको छ।
छवि: माइक्रोसफ्ट

साथै, सन्देश पठाउने सबैभन्दा उन्नत इन्टरफेस होइन, यो सबैभन्दा विस्तारयोग्य हुन सक्छ। उदाहरणका लागि, स्ल्याक लिनुहोस्: तपाइँ यसलाई च्याट एपको रूपमा सोच्नुहुन्छ, तर त्यो पछाडि र अगाडिको इन्टरफेसमा, तपाइँ लिङ्कहरू, सम्पादन योग्य कागजातहरू, अन्तरक्रियात्मक मतदानहरू, सूचनात्मक बटहरू, र अन्य धेरै इम्बेड गर्न सक्नुहुन्छ। WeChat प्रसिद्ध रूपमा एक सम्पूर्ण प्लेटफर्म हो – मूलतया एक सम्पूर्ण इन्टरनेट – सन्देश अनुप्रयोगमा धकेलिएको छ। तपाईं सन्देशको साथ सुरु गर्न सक्नुहुन्छ र धेरै ठाउँहरूमा जान सक्नुहुन्छ।

तर यी धेरै उपकरणहरू एउटै तरिकामा ठोकर्छन्। जानकारीको द्रुत आदानप्रदानको लागि, जस्तै व्यापार घण्टा, च्याट उत्तम छ — प्रश्न सोध्नुहोस्, जवाफ पाउनुहोस्। तर सन्देशहरूको श्रृंखलाको रूपमा क्याटलग ब्राउज गर्दै हुनुहुन्छ? हैन धन्यवाद। एक हजार-सन्देश साथ एक प्लेन टिकट किन्दै अगाडि पछाडि? कठिन पास। यो आवाज सहायकहरू भन्दा फरक छैन, र यदि तपाईंले कहिले पनि Alexa सँग साधारण चीजहरू किन्न प्रयास गर्नुभएको छ भने भगवानले तपाईंलाई मद्दत गर्नुहुन्छ। (“चार्मिनका लागि, ‘तीन भन्नुहोस्।'”) धेरै जटिल चीजहरूको लागि, भिजुअल र समर्पित UI सन्देश विन्डो भन्दा धेरै राम्रो छ।

र जब यो ChatGPT, Bard, Bing, र बाँकीको कुरा आउँछ, चीजहरू साँच्चै छिटो जटिल हुन्छन्। यी मोडेलहरू स्मार्ट र सहयोगी छन्, तर तपाईंले अझै पनि के माग्ने, कुन तरिकामा, र कुन क्रममा आफूले चाहेको कुरा प्राप्त गर्नको लागि ठ्याक्कै जान्नुपर्छ। को विचार “तत्काल इन्जिनियर“तपाईले स्टेबल डिफ्युजनबाट पूर्ण छवि कसरी मिलाउने वा सही जाभास्क्रिप्ट उत्पन्न गर्न ChatGPT प्राप्त गर्ने भनेर जान्नको लागि भुक्तान गर्नुहुन्छ, हास्यास्पद देखिन्छ तर वास्तवमा यो समीकरणको पूर्ण रूपमा आवश्यक अंश हो। यो प्रारम्भिक कम्प्यूटर युगमा भन्दा फरक छैन जब केवल थोरै मानिसहरूलाई कम्प्युटरलाई के गर्ने भनेर कसरी थाहा थियो। त्यहाँ पहिले नै बजारहरू छन् जसमा तपाईंले वास्तवमै उत्कृष्ट प्रम्प्टहरू किन्न र बेच्न सक्नुहुन्छ; त्यहाँ प्रोम्प्ट गुरुहरू र प्रोम्प्टहरूको बारेमा पुस्तकहरू छन्; मलाई लाग्छ कि स्ट्यानफोर्डले पहिले नै प्रम्प्ट इन्जिनियरिङ प्रमुखमा काम गरिरहेको छ जुन सबैले चाँडै लिनेछन्।

जेनेरेटिभ एआईको बारेमा उल्लेखनीय कुरा यो हो कि यसले लगभग केहि गर्न सक्छ जस्तो लाग्छ। यो पनि सम्पूर्ण समस्या हो। जब तपाइँ केहि गर्न सक्नुहुन्छ, तपाइँ के गर्नुहुन्छ? तपाईं कहाँ सुरु गर्नुहुन्छ? तपाइँ कसरी यसलाई कसरी प्रयोग गर्ने भनेर सिक्नुहुन्छ जब तपाइँको एक मात्र विन्डो यसको सम्भाव्यताहरूमा झिम्किने कर्सर हो? अन्ततः, यी कम्पनीहरूले अझ भिजुअल, थप अन्तरक्रियात्मक उपकरणहरू विकास गर्न सक्छन् जसले मानिसहरूलाई उनीहरूले के गर्न सक्छन् र यो कसरी काम गर्दछ भनेर बुझ्न मद्दत गर्दछ। (यो ChatGPT मा नजर राख्ने एउटा कारण हो नयाँ प्लगइन प्रणालीजुन अहिलेको लागि एकदम सीधा छ तर तपाईले च्याट विन्डोमा गर्न सक्ने चीजहरू तुरुन्तै विस्तार गर्न सक्छ।) अहिले, तिनीहरूमध्ये कुनै पनि उत्तम विचार भनेको तपाईले टाइप गर्न सक्ने कुराहरूको बारेमा केही सुझावहरू प्रस्ताव गर्नु हो।

एआई एक सुविधा हुन गइरहेको थियो। अब यो उत्पादन हो। र यसको मतलब पाठ बाकस फिर्ता छ। सन्देश भनेको इन्टरफेस हो, फेरि।



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *