एआई एजेन्ट कसरी बनाउने

एआई एजेन्ट कसरी बनाउने

छोटो उत्तर: व्यवहारमा काम गर्ने एआई एजेन्ट निर्माण गर्न, यसलाई नियन्त्रित लूपको रूपमा व्यवहार गर्नुहोस्: इनपुट लिनुहोस्, अर्को कार्य निर्णय गर्नुहोस्, साँघुरो स्कोप गरिएको उपकरण कल गर्नुहोस्, परिणाम अवलोकन गर्नुहोस्, र स्पष्ट "सम्पन्न" जाँच पास नभएसम्म दोहोर्याउनुहोस्। कार्य बहु-चरण र उपकरण-संचालित हुँदा यसले आफ्नो कायम राख्छ; यदि एकल प्रम्प्टले यसलाई समाधान गर्छ भने, एजेन्ट छोड्नुहोस्। कडा उपकरण योजनाहरू, चरण सीमाहरू, लगिङ, र एक मान्यकर्ता/आलोचक थप्नुहोस् ताकि जब उपकरणहरू असफल हुन्छन् वा इनपुटहरू अस्पष्ट हुन्छन्, एजेन्ट लुपिङको सट्टा बढ्छ।

मुख्य कुराहरू:

नियन्त्रक लूप : स्पष्ट रोक अवस्था र अधिकतम चरणहरू सहित इनपुट → कार्य → पुनरावृत्ति अवलोकन गर्नुहोस्।

उपकरण डिजाइन : "केही पनि गरौं" अराजकता रोक्न उपकरणहरूलाई साँघुरो, टाइप गरिएको, अनुमति दिइएको र मान्य राख्नुहोस्।

मेमोरी हाइजिन : कम्प्याक्ट छोटो अवधिको अवस्था र दीर्घकालीन पुन: प्राप्ति प्रयोग गर्नुहोस्; पूर्ण ट्रान्सक्रिप्टहरू डम्प नगर्नुहोस्।

दुरुपयोग प्रतिरोध : जोखिमपूर्ण कार्यहरूको लागि अनुमति सूची, दर सीमा, अयोग्यता, र "ड्राई-रन" थप्नुहोस्।

परीक्षणयोग्यता : परिदृश्य सुइट (असफलता, अस्पष्टता, इंजेक्शन) कायम राख्नुहोस् र प्रत्येक परिवर्तनमा पुन: चलाउनुहोस्।

एआई एजेन्ट कसरी बनाउने? इन्फोग्राफिक
यसपछि पढ्न मन लाग्ने लेखहरू:

🔗 एआई प्रदर्शन कसरी मापन गर्ने
गति, शुद्धता र विश्वसनीयता मापन गर्न व्यावहारिक मेट्रिक्स सिक्नुहोस्।.

🔗 एआईसँग कसरी कुरा गर्ने
राम्रो उत्तरहरू प्राप्त गर्न प्रम्प्टहरू, सन्दर्भ र फलो-अपहरू प्रयोग गर्नुहोस्।.

🔗 एआई मोडेलहरूको मूल्याङ्कन कसरी गर्ने
परीक्षण, रुब्रिक्स, र वास्तविक-विश्व कार्य परिणामहरू प्रयोग गरेर मोडेलहरूको तुलना गर्नुहोस्।.

🔗 एआई मोडेलहरूलाई कसरी अप्टिमाइज गर्ने
ट्युनिङ, काँटछाँट र अनुगमनको साथ गुणस्तर र लागत सुधार गर्नुहोस्।.


१) सामान्य व्यक्तिको भाषामा एआई एजेन्ट भनेको के हो 🧠

एआई एजेन्ट भनेको एउटा लूप हो। ल्याङ्गचेन “एजेन्ट” कागजातहरू

यति नै हो। बीचमा दिमाग भएको लूप।.

इनपुट → सोच्नुहोस् → कार्य → अवलोकन → दोहोर्याउनुहोस्पुन: कार्य पत्र (कारण + कार्य)

कहाँ:

  • इनपुट भनेको प्रयोगकर्ताको अनुरोध वा कार्यक्रम (नयाँ इमेल, समर्थन टिकट, सेन्सर पिङ) हो।

  • सोच भनेको अर्को चरणको बारेमा तर्क गर्ने भाषा मोडेल हो।

  • ऐनले एउटा उपकरण कल गर्दैछ (आन्तरिक कागजातहरू खोज्नुहोस्, कोड चलाउनुहोस्, टिकट सिर्जना गर्नुहोस्, जवाफ ड्राफ्ट गर्नुहोस्)। ओपनएआई फंक्शन कलिङ गाइड

  • अब्जर्भले टूल आउटपुट पढिरहेको छ।

  • दोहोरिने भागले यसलाई "गफगाफ" को सट्टा "एजेन्टिक" महसुस गराउँछ। LangChain "एजेन्टहरू" कागजातहरू

केही एजेन्टहरू मूलतः स्मार्ट म्याक्रोहरू हुन्। अरूले जुनियर अपरेटर जस्तै काम गर्छन् जसले कार्यहरू मिलाउन सक्छन् र त्रुटिहरूबाट पुन: प्राप्ति गर्न सक्छन्। दुवै महत्त्वपूर्ण छन्।.

साथै, तपाईंलाई पूर्ण स्वायत्तता चाहिँदैन। वास्तवमा... तपाईं सायद यो चाहनुहुन्न 🙃


२) तपाईंले कहिले एजेन्ट बनाउनुपर्छ (र कहिले बनाउनु हुँदैन) 🚦

एजेन्ट बनाउनुहोस् जब:

  • काम बहु-चरणीय र बीचमा के हुन्छ भन्ने आधारमा परिवर्तन हुन्छ।

  • कामको लागि उपकरणको प्रयोग (डाटाबेस, CRM, कोड कार्यान्वयन, फाइल उत्पादन, ब्राउजर, आन्तरिक API)। LangChain “उपकरण” कागजातहरू

  • दोहोर्याउन सकिने परिणामहरू चाहनुहुन्छ , केवल एक-पटक उत्तरहरू होइन।

  • तपाईंले "सम्पन्न" लाई कम्प्युटरले जाँच गर्न सक्ने तरिकाले परिभाषित गर्न सक्नुहुन्छ, खुकुलो रूपमा पनि।.

निम्न अवस्थामा एजेन्ट नबनाउनुहोस्:

  • एउटा साधारण प्रम्प्ट + प्रतिक्रियाले यसलाई समाधान गर्छ (धेरै काम नगर्नुहोस्, पछि तपाईं आफैंलाई घृणा गर्नुहुनेछ)।.

  • तपाईंलाई पूर्ण दृढनिश्चयवाद चाहिन्छ (एजेन्टहरू एकरूप हुन सक्छन्, तर रोबोटिक होइनन्)।.

  • तपाईंसँग जडान गर्न कुनै उपकरण वा डेटा छैन - त्यसो भए यो प्रायः केवल भाइब्स हो।.

स्पष्ट भनौं: "एआई एजेन्ट परियोजनाहरू" मध्ये आधा केही शाखा नियमहरू सहितको कार्यप्रवाह हुन सक्छ। तर हे, कहिलेकाहीँ भाइब पनि महत्त्वपूर्ण हुन्छ 🤷♂️


३) एआई एजेन्टको राम्रो संस्करण के ले बनाउँछ ✅

तपाईंले सोध्नुभएको "राम्रो संस्करण के ले बनाउँछ" खण्ड यहाँ छ, तर म अलि स्पष्ट हुनेछु:

एआई एजेन्टको राम्रो संस्करण होइन जसले सबैभन्दा कडा सोच्दछ। यो त्यो हो जसले:

यदि तपाईंको एजेन्टको परीक्षण गर्न सकिँदैन भने, यो मूलतः एक धेरै आत्मविश्वासी स्लट मेसिन हो। पार्टीहरूमा रमाइलो, उत्पादनमा भयानक 😬


४) एजेन्टको मुख्य निर्माण तत्वहरू ("शरीर रचना" 🧩)

धेरैजसो ठोस एजेन्टहरूमा यी टुक्राहरू हुन्छन्:

क) नियन्त्रक लूप 🔁

यो अर्केस्ट्रेटर हो:

  • लक्ष्य लिनुहोस्

  • अर्को कार्यको लागि मोडेललाई सोध्नुहोस्

  • चलाउने उपकरण

  • अवलोकन थप्नुहोस्

  • पूरा नभएसम्म दोहोर्याउनुहोस् LangChain “एजेन्ट” कागजातहरू

ख) उपकरणहरू (उर्फ क्षमताहरू) 🧰

उपकरणहरूले एजेन्टलाई प्रभावकारी बनाउँछन्: LangChain “उपकरणहरू” कागजातहरू

  • डाटाबेस प्रश्नहरू

  • इमेल पठाउँदै

  • फाइलहरू तान्दै

  • चलिरहेको कोड

  • आन्तरिक API हरू कल गर्दै

  • स्प्रेडसिट वा CRM मा लेख्दै

ग) स्मृति 🗃️

दुई प्रकारका कुराहरू:

  • अल्पकालीन स्मृति : वर्तमान चलिरहेको सन्दर्भ, हालका चरणहरू, वर्तमान योजना

  • दीर्घकालीन स्मृति : प्रयोगकर्ता प्राथमिकताहरू, परियोजना सन्दर्भ, प्राप्त ज्ञान (प्रायः इम्बेडिङहरू + भेक्टर स्टोर मार्फत) RAG पेपर

घ) योजना र निर्णय नीति 🧭

यदि तपाईंले यसलाई "योजना" भन्नुभएन भने पनि, तपाईंलाई एउटा विधि चाहिन्छ:

ङ) रेलिङ र मूल्याङ्कन 🧯

हो, यो प्रोत्साहन भन्दा बढी इन्जिनियरिङ हो। जुन... एक प्रकारको कुरा हो।.


५) तुलना तालिका: एजेन्ट निर्माण गर्ने लोकप्रिय तरिकाहरू 🧾

तल एउटा यथार्थपरक "तुलना तालिका" दिइएको छ - केही विशेषताहरू सहित, किनभने वास्तविक टोलीहरू अनौठा हुन्छन् 😄

उपकरण / फ्रेमवर्क दर्शक मूल्य यो किन काम गर्छ? नोटहरू (सानो अराजकता)
ल्याङ्चेन लेगो-शैलीका कम्पोनेन्टहरू मन पराउने निर्माणकर्ताहरू फ्री-इश + इन्फ्रा उपकरण, मेमोरी, चेनहरूको लागि ठूलो इकोसिस्टम यदि तपाईंले स्पष्ट रूपमा नाम दिनुभएन भने स्पेगेटी-छिटो हुन सक्छ
लामाइन्डेक्स RAG-हेभी टोलीहरू फ्री-इश + इन्फ्रा बलियो पुन: प्राप्ति ढाँचाहरू, अनुक्रमणिका, कनेक्टरहरू तपाईंको एजेन्ट मूलतः "खोज + कार्य" गर्ने हुँदा राम्रो हुन्छ... जुन सामान्य कुरा हो
ओपनएआई सहायक शैली दृष्टिकोण छिटो सेटअप चाहने टोलीहरू प्रयोगमा आधारित निर्मित उपकरण कलिङ ढाँचा र रन अवस्था केही कुनाहरूमा कम लचिलो, तर धेरै एपहरूको लागि सफा OpenAI ले API OpenAI Assistants फंक्शन कलिङ
अर्थपूर्ण कर्नेल संरचित अर्केस्ट्रेसन चाहने विकासकर्ताहरू स्वतन्त्र सीप/कार्यहरूको लागि सफा अमूर्तता "उद्यम सफा" लाग्छ - कहिलेकाहीँ त्यो प्रशंसा हो 😉
अटोजेन बहु-एजेन्ट प्रयोगकर्ताहरू स्वतन्त्र एजेन्ट-टु-एजेन्ट सहकार्य ढाँचाहरू धेरै कुरा गर्न सक्छ; कडा समाप्ति नियमहरू सेट गर्नुहोस्
क्रूएआई "एजेन्टहरूको टोली" प्रशंसकहरू स्वतन्त्र भूमिका + कार्यहरू + हस्तान्तरणहरू व्यक्त गर्न सजिलो छ कामहरू चिल्लो नभएर कुरकुरा हुँदा राम्रो काम गर्छ
घाँसको ढिस्को खोज + पाइपलाइन मान्छेहरू स्वतन्त्र ठोस पाइपलाइनहरू, पुन: प्राप्ति, घटकहरू कम "एजेन्ट थिएटर", बढी "व्यावहारिक कारखाना"
आफ्नै रोल गर्नुहोस् (अनुकूलन लूप) नियन्त्रण गर्ने पागलहरू (मायालु) तिम्रो समय न्यूनतम जादू, अधिकतम स्पष्टता सामान्यतया सबैभन्दा राम्रो दीर्घकालीन... जबसम्म तपाईंले सबै कुरा पुन: आविष्कार गर्नुहुन्न 😅

कुनै एकल विजेता छैन। उत्तम छनोट तपाईंको एजेन्टको मुख्य काम पुन: प्राप्ति , उपकरण कार्यान्वयन , बहु-एजेन्ट समन्वय , वा कार्यप्रवाह स्वचालन


६) चरणबद्ध रूपमा एआई एजेन्ट कसरी बनाउने (वास्तविक नुस्खा) 🍳🤖

यो भाग धेरैजसो मानिसहरूले छोड्छन्, अनि सोच्छन् किन एजेन्टले पेन्ट्रीमा र्‍याकुन जस्तो व्यवहार गर्छ।.

चरण १: कामलाई एक वाक्यमा परिभाषित गर्नुहोस् 🎯

उदाहरणहरू:

  • "नीति र टिकट सन्दर्भ प्रयोग गरेर ग्राहकको जवाफको मस्यौदा तयार गर्नुहोस्, त्यसपछि स्वीकृतिको लागि सोध्नुहोस्।"

  • "बग रिपोर्टको अनुसन्धान गर्नुहोस्, यसलाई पुन: उत्पादन गर्नुहोस्, र समाधान प्रस्ताव गर्नुहोस्।"

  • "अपूर्ण बैठक नोटहरूलाई कार्य, मालिक र समयसीमामा परिणत गर्नुहोस्।"

यदि तपाईं यसलाई सरल रूपमा परिभाषित गर्न सक्नुहुन्न भने, तपाईंको एजेन्टले पनि सक्दैन। मेरो मतलब यो गर्न सक्छ, तर यसले सुधार गर्नेछ, र सुधार त्यो हो जहाँ बजेट मर्छ।.

चरण २: स्वायत्तता स्तर (कम, मध्यम, मसालेदार) निर्णय गर्नुहोस् 🌶️

  • कम स्वायत्तता : चरणहरू सुझाव दिन्छ, मानव क्लिकहरूले "अनुमोदन" गर्छन्

  • माध्यम : उपकरणहरू चलाउँछ, आउटपुट ड्राफ्ट गर्छ, अनिश्चिततामा बढ्छ

  • उच्च : ले अन्त्य-देखि-अन्त कार्यान्वयन गर्छ, अपवादहरूमा मात्र मानिसहरूलाई पिंग गर्छ।

तपाईंले चाहेको भन्दा तल सुरु गर्नुहोस्। तपाईं पछि यसलाई सधैं क्र्याङ्क गर्न सक्नुहुन्छ।.

चरण ३: आफ्नो मोडेल रणनीति छान्नुहोस् 🧠

तपाईंले सामान्यतया छनौट गर्नुहुन्छ:

  • सबै कुराको लागि एउटा बलियो मोडेल (सरल)

  • सस्तो चरणहरूको लागि एउटा बलियो मोडेल + सानो मोडेल (वर्गीकरण, मार्ग)

  • आवश्यक परेमा विशेष मोडेलहरू (दृष्टि, कोड, भाषण)

यो पनि निर्णय गर्नुहोस्:

  • अधिकतम टोकनहरू

  • तापक्रम

  • के तपाईं आन्तरिक रूपमा लामो तर्क ट्रेसहरूलाई अनुमति दिनुहुन्छ (तपाईं सक्नुहुन्छ, तर कच्चा विचारको श्रृंखलालाई अन्तिम प्रयोगकर्ताहरूलाई उजागर नगर्नुहोस्)

चरण ४: कडा योजनाहरू सहित उपकरणहरू परिभाषित गर्नुहोस् 🔩

उपकरणहरू निम्न हुनुपर्छ:

do_anything(input: string) भनिने उपकरणको सट्टा , बनाउनुहोस्:

  • search_kb(क्वेरी: स्ट्रिङ) -> नतिजाहरू[]

  • टिकट_सिर्जना गर्नुहोस् (शीर्षक: स्ट्रिङ, मुख्य भाग: स्ट्रिङ, प्राथमिकता: enum) -> टिकट_आईडी

  • send_email(to: string, subject: string, body: string) -> status OpenAI प्रकार्य कल गर्ने गाइड

यदि तपाईंले एजेन्टलाई चेनसा दिनुभयो भने, उसले बार हटाएर हेज काट्दा अचम्म नमान्नुहोस्।.

चरण ५: नियन्त्रक लूप बनाउनुहोस् 🔁

न्यूनतम लूप:

  1. लक्ष्य + प्रारम्भिक सन्दर्भबाट सुरु गर्नुहोस्

  2. मोडेललाई सोध्नुहोस्: "अर्को कार्य?"

  3. यदि उपकरण कल - उपकरण कार्यान्वयन गर्नुहोस्

  4. अवलोकन थप्नुहोस्

  5. रोकिने अवस्था जाँच गर्नुहोस्

  6. दोहोर्याउनुहोस् (अधिकतम चरणहरू सहित) LangChain “एजेन्टहरू” कागजातहरू

थप्नुहोस्:

चरण ६: ध्यानपूर्वक मेमोरी थप्नुहोस् 🗃️

छोटो अवधि: हरेक चरणमा अद्यावधिक गरिएको कम्प्याक्ट "स्टेट सारांश" राख्नुहोस्। LangChain "मेमोरी सिंहावलोकन"
दीर्घकालीन: टिकाउ तथ्यहरू भण्डारण गर्नुहोस् (प्रयोगकर्ता प्राथमिकताहरू, संगठन नियमहरू, स्थिर कागजातहरू)।

सामान्य नियम:

  • यदि यो बारम्बार परिवर्तन हुन्छ भने - यसलाई छोटो अवधिको लागि राख्नुहोस्

  • यदि यो स्थिर छ भने - लामो समयसम्म भण्डारण गर्नुहोस्

  • यदि यो संवेदनशील छ भने - कम मात्रामा भण्डारण गर्नुहोस् (वा पटक्कै होइन)

चरण ७: प्रमाणीकरण र "आलोचक" पास थप्नुहोस् 🧪

एउटा सस्तो, व्यावहारिक ढाँचा:

  • एजेन्टले परिणाम उत्पन्न गर्छ

  • मान्यकर्ताले संरचना र अवरोधहरू जाँच गर्दछ

  • छुटेका चरणहरू वा नीति उल्लङ्घनहरूको लागि वैकल्पिक आलोचक मोडेल समीक्षाहरू NIST AI RMF 1.0

पूर्ण छैन, तर यसले अचम्मलाग्दो मात्रामा बकवासहरू समात्छ।.

चरण ८: लग इन नगरेकोमा पछुताउनु पर्ने सबै कुराहरू लग गर्नुहोस् 📜

लग:

भविष्य - तिमीले धन्यवाद दिनेछौ। वर्तमान - तिमीले बिर्सनेछौ। त्यो त जीवन हो 😵💫


७) तपाईंको आत्मालाई नतोड्ने उपकरण कलिङ 🧰😵

"एआई एजेन्ट कसरी बनाउने" भन्ने कुरा उपकरण कलिङबाट वास्तविक सफ्टवेयर इन्जिनियरिङ बन्छ।.

उपकरणहरूलाई भरपर्दो बनाउनुहोस् (भरपर्दो राम्रो हो)

भरपर्दो उपकरणहरू हुन्:

उपकरण तहमा रेलिङहरू थप्नुहोस्, केवल प्रम्प्टहरू मात्र होइन।

प्रम्प्टहरू विनम्र सुझावहरू हुन्। उपकरण प्रमाणीकरण एक बन्द ढोका हो। OpenAI संरचित आउटपुटहरू

गर्नुहोस्:

  • अनुमति सूचीहरू (कुन उपकरणहरू चलाउन सकिन्छ)

  • इनपुट प्रमाणीकरण

  • दर सीमा ओपनएआई दर सीमा गाइड

  • प्रति प्रयोगकर्ता/संस्था अनुमति जाँच

  • जोखिमपूर्ण कार्यहरूको लागि "ड्राई-रन मोड"

आंशिक विफलताको लागि डिजाइन

उपकरणहरू असफल हुन्छन्। नेटवर्कहरू डगमगाउँछन्। प्रमाणीकरणको म्याद सकिन्छ। एजेन्टले निम्न कुराहरू गर्नुपर्छ:

एउटा शान्त प्रभावकारी तरिका: संरचित त्रुटिहरू फर्काउनुहोस् जस्तै:

  • प्रकार: auth_error

  • प्रकार: फेला परेन

  • प्रकार: rate_limited
    त्यसैले मोडेलले आत्तिनुको सट्टा बुद्धिमानीपूर्वक प्रतिक्रिया दिन सक्छ।


८) तपाईंलाई सताउनुको सट्टा मद्दत गर्ने सम्झना 👻🗂️

स्मरणशक्ति शक्तिशाली हुन्छ, तर यो रद्दीको दराज पनि बन्न सक्छ।.

छोटो अवधिको स्मृति: यसलाई संकुचित राख्नुहोस्

प्रयोग गर्नुहोस्:

  • अन्तिम N चरणहरू

  • चलिरहेको सारांश (हरेक लूप अद्यावधिक गरिएको)

  • हालको योजना

  • वर्तमान अवरोधहरू (बजेट, समय, नीतिहरू)

यदि तपाईंले सबै कुरालाई सन्दर्भमा फ्याँक्नुभयो भने, तपाईंले पाउनुहुनेछ:

  • बढी लागत

  • ढिलो विलम्बता

  • थप भ्रम (हो, त्यसो भए पनि)

दीर्घकालीन स्मृति: "भरिएको" माथि पुन: प्राप्ति

धेरैजसो "दीर्घकालीन स्मृति" यस प्रकारको हुन्छ:

  • इम्बेडिङहरू

  • भेक्टर स्टोर

  • पुन: प्राप्ति संवर्धित पुस्ता (RAG) RAG पेपर

एजेन्टले सम्झँदैन। यसले रनटाइममा सबैभन्दा सान्दर्भिक स्निपेटहरू पुन: प्राप्त गर्दछ। LlamaIndex “RAG को परिचय”

व्यावहारिक स्मृति नियमहरू

  • "प्राथमिकताहरू" लाई स्पष्ट तथ्यको रूपमा भण्डारण गर्नुहोस्: "प्रयोगकर्तालाई बुलेट सारांश मन पर्छ र इमोजीहरू घृणा गर्छन्" (हाहा, यहाँ होइन 😄)

  • टाइमस्ट्याम्प वा संस्करणहरू सहित "निर्णयहरू" भण्डारण गर्नुहोस् (अन्यथा विरोधाभासहरू थुप्रिन्छन्)

  • साँच्चै आवश्यक परेमा बाहेक कहिल्यै पनि गोप्य कुराहरू नराख्नुहोस्

अनि यहाँ मेरो अपूर्ण रूपक छ: सम्झना फ्रिज जस्तै हो। यदि तपाईंले यसलाई कहिल्यै सफा गर्नुभएन भने, अन्ततः तपाईंको स्यान्डविच प्याज र पछुतो जस्तै स्वादिष्ट हुनेछ।.


९) योजना ढाँचाहरू (सरल देखि फेन्सी सम्म) 🧭✨

योजना भनेको केवल नियन्त्रित विघटन हो। यसलाई रहस्यमय नबनाउनुहोस्।.

ढाँचा A: चेकलिस्ट योजनाकार ✅

  • मोडेलले चरणहरूको सूची आउटपुट गर्दछ

  • चरण-दर-चरण कार्यान्वयन गर्दछ

  • चेकलिस्टको स्थिति अद्यावधिक गर्छ

अनबोर्डिङको लागि उत्कृष्ट। सरल, परीक्षणयोग्य।.

ढाँचा B: ReAct लूप (कारण + कार्य) 🧠→🧰

  • मोडेलले अर्को उपकरण कल निर्णय गर्छ

  • आउटपुट अवलोकन गर्दछ

  • ReAct पेपर दोहोर्‍याउँछ

यो क्लासिक एजेन्ट अनुभूति हो।.

ढाँचा C: पर्यवेक्षक-कार्यकर्ता 👥

कार्यहरू समानान्तर गर्न सकिने अवस्थामा वा तपाईं फरक "भूमिका" चाहनुहुन्छ भने यो मूल्यवान हुन्छ जस्तै:

  • अनुसन्धानकर्ता

  • कोडर

  • सम्पादक

  • QA परीक्षक

ढाँचा D: पुन: योजना बनाएर योजना बनाउनुहोस् र त्यसपछि कार्यान्वयन गर्नुहोस् 🔄

  • योजना बनाउनुहोस्

  • कार्यान्वयन गर्नु

  • यदि उपकरणको नतिजाले वास्तविकता परिवर्तन गर्छ भने, पुन: योजना बनाउनुहोस्

यसले एजेन्टलाई जिद्दीपूर्वक खराब योजना पछ्याउनबाट रोक्छ। मानिसहरूले पनि यो गर्छन्, जबसम्म तिनीहरू थकित हुँदैनन्, त्यस्तो अवस्थामा तिनीहरूले पनि खराब योजनाहरू पछ्याउँछन्।.


१०) सुरक्षा, विश्वसनीयता, र जागिरबाट निकालिनु हुँदैन 🔐😅

यदि तपाईंको एजेन्टले कारबाही गर्न सक्छ भने, तपाईंलाई सुरक्षा डिजाइन चाहिन्छ। "हुनु राम्रो" होइन। आवश्यक छ। NIST AI RMF १.०

कडा सीमाहरू

  • प्रति दौड अधिकतम चरणहरू

  • प्रति मिनेट अधिकतम उपकरण कलहरू

  • प्रति सत्र अधिकतम खर्च (टोकन बजेट)

  • अनुमोदन पछाडि प्रतिबन्धित उपकरणहरू

डेटा ह्यान्डलिङ

  • लगिङ गर्नु अघि संवेदनशील इनपुटहरू सम्पादन गर्नुहोस्

  • अलग वातावरण (विकासकर्ता बनाम उत्पादन)

  • न्यूनतम-विशेषाधिकार प्राप्त उपकरण अनुमतिहरू

व्यवहारिक अवरोधहरू

  • एजेन्टलाई आन्तरिक प्रमाणका अंशहरू उद्धृत गर्न बाध्य पार्नुहोस् (बाह्य लिङ्कहरू होइन, केवल आन्तरिक सन्दर्भहरू)

  • आत्मविश्वास कम हुँदा अनिश्चितता झण्डाहरू आवश्यक पर्दछ

  • यदि इनपुटहरू अस्पष्ट छन् भने "स्पष्टीकरण प्रश्न सोध्नुहोस्" आवश्यक छ

भरपर्दो एजेन्ट सबैभन्दा विश्वस्त हुँदैन। यो त्यो हो जसलाई थाहा हुन्छ कि कहिले अनुमान लगाइन्छ... र त्यसो भन्छ।.


११) परीक्षण र मूल्याङ्कन (सबैले बेवास्ता गर्ने भाग) 🧪📏

तपाईंले मापन गर्न नसक्ने कुरालाई सुधार गर्न सक्नुहुन्न। हो, त्यो लाइन मूर्खतापूर्ण छ, तर यो कष्टकर रूपमा सत्य हो।.

परिदृश्य सेट बनाउनुहोस्

३०-१०० परीक्षण केसहरू सिर्जना गर्नुहोस्:

स्कोर परिणामहरू

जस्तै मेट्रिक्स प्रयोग गर्नुहोस्:

  • कार्य सफलता दर

  • पूरा हुने समय

  • उपकरण त्रुटि रिकभरी दर

  • भ्रम दर (प्रमाण बिनाको दावी)

  • मानव स्वीकृति दर (यदि सुपरिवेक्षण गरिएको मोडमा छ भने)

प्रम्प्ट र उपकरणहरूको लागि रिग्रेसन परीक्षणहरू

तपाईंले कुनै पनि समयमा परिवर्तन गर्नुहुन्छ:

  • उपकरण योजना

  • प्रणाली निर्देशनहरू

  • पुन: प्राप्ति तर्क

  • मेमोरी ढाँचा
    सुइट फेरि चलाउनुहोस्।

एजेन्टहरू संवेदनशील जनावर हुन्। घरका बिरुवाहरू जस्तै, तर महँगो।.


१२) तपाईंको बजेट नपग्लने डिप्लोयमेन्ट ढाँचाहरू 💸🔥

एउटा सेवाबाट सुरु गर्नुहोस्

लागत नियन्त्रणहरू चाँडै थप्नुहोस्

  • क्यासिङ पुन:प्राप्ति परिणामहरू

  • सारांशहरू सहित कुराकानी अवस्था संकुचित गर्दै

  • राउटिङ र एक्स्ट्र्याक्शनको लागि साना मोडेलहरू प्रयोग गर्दै

  • "गहिरो सोच मोड" लाई कठिन चरणहरूमा सीमित गर्दै

सामान्य वास्तुकला विकल्प

  • स्टेटलेस कन्ट्रोलर + बाह्य स्टेट स्टोर (DB/redis)

  • उपकरण कलहरू सम्भव भएसम्म अयोग्य हुन्छन् स्ट्राइप "अयोग्य अनुरोधहरू"

  • लामो कार्यहरूको लागि लाइन (ताकि तपाईंले वेब अनुरोध सधैंभरि खुला राख्नुहुन्न)

साथै: "किल स्विच" बनाउनुहोस्। तपाईंलाई यसको आवश्यकता पर्दैन जबसम्म तपाईंलाई साँच्चै आवश्यक पर्दैन 😬


१३) समापन नोटहरू - एआई एजेन्ट कसरी बनाउने भन्ने छोटो संस्करण 🎁🤖

यदि तपाईंलाई अरू केही याद छैन भने, यो सम्झनुहोस्:

एजेन्ट जादु होइन। यो त्यस्तो प्रणाली हो जसले मूल्यवान हुन पर्याप्त राम्रा निर्णयहरू गर्छ... र क्षति पुर्‍याउनु अघि नै हार स्वीकार गर्छ। शान्तपूर्वक सान्त्वनादायी, एक तरिकाले 😌

अनि हो, यदि तपाईंले यसलाई सही तरिकाले निर्माण गर्नुभयो भने, यो एक सानो डिजिटल इन्टर्नलाई काममा राख्नु जस्तै महसुस हुन्छ जो कहिल्यै सुत्दैन, कहिलेकाहीं आत्तिन्छ, र कागजी कार्य मन पराउँछ। त्यसैले, मूलतः एक इन्टर्न।.


सोधिने प्रश्न

सरल शब्दमा भन्नु पर्दा एआई एजेन्ट भनेको के हो?

एआई एजेन्ट मूलतः एक लूप हो जुन दोहोरिन्छ: इनपुट लिनुहोस्, अर्को चरण निर्णय गर्नुहोस्, उपकरण प्रयोग गर्नुहोस्, नतिजा पढ्नुहोस्, र यो पूरा नभएसम्म दोहोर्याउनुहोस्। "एजेन्टिक" भाग अभिनय र अवलोकनबाट आउँछ, केवल च्याटिङबाट होइन। धेरै एजेन्टहरू उपकरण पहुँचको साथ केवल स्मार्ट स्वचालन हुन्, जबकि अरूले त्रुटिहरूबाट पुन: प्राप्ति गर्न सक्ने जुनियर अपरेटर जस्तै व्यवहार गर्छन्।.

प्रम्प्ट प्रयोग गर्नुको सट्टा मैले कहिले एआई एजेन्ट निर्माण गर्नुपर्छ?

काम बहु-चरणीय हुँदा, मध्यवर्ती परिणामहरूमा आधारित परिवर्तन हुँदा, र भरपर्दो उपकरण प्रयोग (API, डाटाबेस, टिकटिङ, कोड कार्यान्वयन) आवश्यक पर्दा एजेन्ट बनाउनुहोस्। एजेन्टहरू पनि उपयोगी हुन्छन् जब तपाईं रेलिङहरू र "सम्पन्न" जाँच गर्ने तरिकाको साथ दोहोर्याउन मिल्ने परिणामहरू चाहनुहुन्छ। यदि एक साधारण प्रम्प्ट-प्रतिक्रियाले काम गर्छ भने, एजेन्ट सामान्यतया अनावश्यक ओभरहेड र अतिरिक्त विफलता मोडहरू हुन्छन्।.

म कसरी एउटा एआई एजेन्ट निर्माण गर्न सक्छु जुन लूपहरूमा अड्किएन?

हार्ड स्टप अवस्थाहरू प्रयोग गर्नुहोस्: अधिकतम चरणहरू, अधिकतम उपकरण कलहरू, र स्पष्ट पूर्णता जाँचहरू। संरचित उपकरण योजनाहरू, टाइमआउटहरू, र पुन: प्रयासहरू थप्नुहोस् जुन सधैंभरि पुन: प्रयास गर्दैन। निर्णयहरू र उपकरण आउटपुटहरू लग गर्नुहोस् ताकि तपाईं यो कहाँ पटरीबाट खस्छ भनेर देख्न सक्नुहुन्छ। एक सामान्य सुरक्षा भल्भ एस्केलेसन हो: यदि एजेन्ट अनिश्चित छ वा त्रुटिहरू दोहोर्याउँछ भने, यसले सुधार गर्नुको सट्टा मद्दत माग्नु पर्छ।.

एआई एजेन्ट कसरी बनाउने भन्ने बारे न्यूनतम संरचना कति हो?

कम्तिमा तपाईंलाई एउटा नियन्त्रक लूप चाहिन्छ जसले मोडेललाई लक्ष्य र सन्दर्भ प्रदान गर्दछ, अर्को कार्यको लागि सोध्छ, अनुरोध गरिएको खण्डमा उपकरण कार्यान्वयन गर्दछ, अवलोकन थप्छ, र दोहोर्याउँछ। तपाईंलाई कडा इनपुट/आउटपुट आकारहरू र "सम्पन्न" जाँच भएका उपकरणहरू पनि चाहिन्छ। यदि तपाईंले राज्य सफा राख्नुहुन्छ र चरण सीमाहरू लागू गर्नुहुन्छ भने रोल-योर-ओन लूपले पनि राम्रोसँग काम गर्न सक्छ।.

उत्पादनमा भरपर्दो बनाउन मैले उपकरण कलिङ कसरी डिजाइन गर्नुपर्छ?

उपकरणहरूलाई साँघुरो, टाइप गरिएको, अनुमति दिइएको, र मान्य राख्नुहोस्—जेनेरिक "do_anything" उपकरणबाट बच्नुहोस्। कडा स्किमाहरू (जस्तै संरचित आउटपुटहरू/फंक्शन कलिङ) लाई प्राथमिकता दिनुहोस् ताकि एजेन्टले इनपुटहरूलाई हातले हल्लाउन नसकोस्। उपकरण तहमा अनुमति सूचीहरू, दर सीमाहरू, र प्रयोगकर्ता/संस्था अनुमति जाँचहरू थप्नुहोस्। सम्भव भएसम्म पुन: चलाउन सुरक्षित हुने गरी डिजाइन उपकरणहरू, idempotency ढाँचाहरू प्रयोग गर्नुहोस्।.

एजेन्टलाई नराम्रो नबनाई मेमोरी थप्ने उत्तम तरिका के हो?

मेमोरीलाई दुई भागको रूपमा व्यवहार गर्नुहोस्: छोटो अवधिको रन अवस्था (हालका चरणहरू, हालको योजना, अवरोधहरू) र दीर्घकालीन पुन: प्राप्ति (प्राथमिकताहरू, स्थिर नियमहरू, सान्दर्भिक कागजातहरू)। छोटो अवधिको कम्प्याक्ट चलिरहेको सारांशहरू राख्नुहोस्, पूर्ण ट्रान्सक्रिप्टहरू होइन। दीर्घकालीन मेमोरीको लागि, पुन: प्राप्ति (एम्बेडिंगहरू + भेक्टर स्टोर/RAG ढाँचाहरू) ले सामान्यतया सबै कुरालाई सन्दर्भमा "स्टफिंग" गर्ने र मोडेललाई भ्रमित गर्ने कामलाई हराउँछ।.

मैले कुन योजना ढाँचा प्रयोग गर्नुपर्छ: चेकलिस्ट, ReAct, वा सुपरिवेक्षक-कार्यकर्ता?

कार्यहरू अनुमान गर्न सकिने अवस्थामा र तपाईं परीक्षण गर्न सजिलो कुरा चाहनुहुन्छ भने चेकलिस्ट प्लानर राम्रो हुन्छ। उपकरणको नतिजाले तपाईंले अर्को गर्ने काम परिवर्तन गर्दा ReAct-शैलीका लूपहरू चम्कन्छन्। कार्यहरूलाई समानान्तर गर्न वा फरक भूमिकाहरू (अनुसन्धानकर्ता, कोडर, QA) बाट लाभ उठाउन सकेमा सुपरिवेक्षक-कार्यकर्ता ढाँचाहरू (जस्तै AutoGen-शैली भूमिका विभाजन) ले मद्दत गर्दछ। जिद्दी खराब योजनाहरूबाट बच्नको लागि योजना बनाउनुहोस्-त्यसपछि-कार्यान्वयन गर्नुहोस् एक व्यावहारिक मध्य आधार हो।.

यदि एजेन्टले वास्तविक कारबाही गर्न सक्छ भने म कसरी उसलाई सुरक्षित बनाउन सक्छु?

न्यूनतम-विशेषाधिकार अनुमतिहरू प्रयोग गर्नुहोस् र अनुमोदन वा "ड्राई-रन" मोडहरू पछाडि जोखिमपूर्ण उपकरणहरू प्रतिबन्धित गर्नुहोस्। बजेट र क्याप्स थप्नुहोस्: अधिकतम चरणहरू, अधिकतम खर्च, र प्रति-मिनेट उपकरण कल सीमाहरू। लगिङ गर्नु अघि संवेदनशील डेटा सम्पादन गर्नुहोस्, र उत्पादन वातावरणबाट विकासकर्तालाई अलग गर्नुहोस्। विश्वासले प्रमाणलाई प्रतिस्थापन गर्न दिनुको सट्टा इनपुटहरू अस्पष्ट हुँदा अनिश्चितता झण्डाहरू वा स्पष्टीकरण प्रश्नहरू आवश्यक पर्दछ।.

समयसँगै सुधार होस् भनेर म कसरी एआई एजेन्टको परीक्षण र मूल्याङ्कन गर्न सक्छु?

खुशी मार्गहरू, किनारा केसहरू, उपकरण विफलताहरू, अस्पष्ट अनुरोधहरू, र प्रम्प्ट-इन्जेक्शन प्रयासहरू (OWASP-शैली) सहितको परिदृश्य सुइट बनाउनुहोस्। कार्य सफलता, समय-समय-समाप्ति, उपकरण त्रुटिहरूबाट पुन: प्राप्ति, र प्रमाण बिना दावीहरू जस्ता परिणामहरू स्कोर गर्नुहोस्। तपाईंले उपकरण योजनाहरू, प्रम्प्टहरू, पुन: प्राप्ति, वा मेमोरी ढाँचा परिवर्तन गर्दा, सुइट पुन: चलाउनुहोस्। यदि तपाईंले यसलाई परीक्षण गर्न सक्नुहुन्न भने, तपाईं यसलाई विश्वसनीय रूपमा पठाउन सक्नुहुन्न।.

ढिलाइ र लागत नबढाई म कसरी एजेन्ट तैनाथ गर्न सक्छु?

एउटा सामान्य ढाँचा भनेको बाह्य स्टेट स्टोर (DB/Redis), यसको पछाडि उपकरण सेवाहरू, र बलियो लगिङ/निगरानी (प्रायः OpenTelemetry) भएको स्टेटलेस नियन्त्रक हो। पुन: प्राप्ति क्यासिङ, कम्प्याक्ट स्टेट सारांशहरू, राउटिङ/निकासीका लागि साना मोडेलहरू, र "गहिरो सोच" लाई सबैभन्दा कठिन चरणहरूमा सीमित गरेर लागत नियन्त्रण गर्नुहोस्। लामो कार्यहरूको लागि लाइनहरू प्रयोग गर्नुहोस् ताकि तपाईंले वेब अनुरोधहरू खुला राख्नुहुन्न। सधैं किल स्विच समावेश गर्नुहोस्।.

सन्दर्भ सामग्रीहरू

  1. राष्ट्रिय मानक तथा प्रविधि संस्थान (NIST) - NIST AI RMF 1.0 (विश्वसनीयता र पारदर्शिता) - nvlpubs.nist.gov

  2. ओपनएआई - संरचित आउटपुटहरू - platform.openai.com

  3. OpenAI - प्रकार्य कलिङ गाइड - platform.openai.com

  4. ओपनएआई - दर सीमा गाइड - platform.openai.com

  5. OpenAI - API चलाउँछ - platform.openai.com

  6. ओपनएआई - सहायक फंक्शन कलिङ - platform.openai.com

  7. ल्याङ्गचेन - एजेन्ट कागजातहरू (जाभास्क्रिप्ट) - docs.langchain.com

  8. LangChain - उपकरण कागजातहरू (पाइथन) - docs.langchain.com

  9. ल्याङ्गचेन - मेमोरी सिंहावलोकन - docs.langchain.com

  10. arXiv - ReAct पेपर (कारण + कार्य) - arxiv.org

  11. arXiv - RAG पेपर - arxiv.org

  12. अमेजन वेब सर्भिसेज (AWS) बिल्डर्स लाइब्रेरी - टाइमआउट, पुन: प्रयास, र जिटरको साथ ब्याकअफ - aws.amazon.com

  13. ओपनटेलिमेट्री - अवलोकनयोग्यता प्राइमर - opentelemetry.io

  14. स्ट्राइप - अदम्य अनुरोधहरू - docs.stripe.com

  15. गुगल क्लाउड - पुन: प्रयास रणनीति (ब्याकअफ + जिटर) - docs.cloud.google.com

  16. OWASP - ठूला भाषा मोडेल अनुप्रयोगहरूको लागि शीर्ष १० - owasp.org

  17. OWASP - LLM01 प्रम्प्ट इन्जेक्सन - genai.owasp.org

  18. LlamaIndex - RAG को परिचय - developers.llamaindex.ai

  19. माइक्रोसफ्ट - सिमेन्टिक कर्नेल - learn.microsoft.com

  20. माइक्रोसफ्ट अटोजेन - बहु-एजेन्ट फ्रेमवर्क (दस्तावेजीकरण) - microsoft.github.io

  21. CrewAI - एजेन्ट अवधारणाहरू - docs.crewai.com

  22. घाँसको ढिस्को (डीपसेट) - रिट्रिभर्स कागजात - docs.haystack.deepset.ai

आधिकारिक एआई सहायक स्टोरमा नवीनतम एआई खोज्नुहोस्

हाम्रो बारेमा

ब्लगमा फर्कनुहोस्