छोटो उत्तर: व्यवहारमा काम गर्ने एआई एजेन्ट निर्माण गर्न, यसलाई नियन्त्रित लूपको रूपमा व्यवहार गर्नुहोस्: इनपुट लिनुहोस्, अर्को कार्य निर्णय गर्नुहोस्, साँघुरो स्कोप गरिएको उपकरण कल गर्नुहोस्, परिणाम अवलोकन गर्नुहोस्, र स्पष्ट "सम्पन्न" जाँच पास नभएसम्म दोहोर्याउनुहोस्। कार्य बहु-चरण र उपकरण-संचालित हुँदा यसले आफ्नो कायम राख्छ; यदि एकल प्रम्प्टले यसलाई समाधान गर्छ भने, एजेन्ट छोड्नुहोस्। कडा उपकरण योजनाहरू, चरण सीमाहरू, लगिङ, र एक मान्यकर्ता/आलोचक थप्नुहोस् ताकि जब उपकरणहरू असफल हुन्छन् वा इनपुटहरू अस्पष्ट हुन्छन्, एजेन्ट लुपिङको सट्टा बढ्छ।
मुख्य कुराहरू:
नियन्त्रक लूप : स्पष्ट रोक अवस्था र अधिकतम चरणहरू सहित इनपुट → कार्य → पुनरावृत्ति अवलोकन गर्नुहोस्।
उपकरण डिजाइन : "केही पनि गरौं" अराजकता रोक्न उपकरणहरूलाई साँघुरो, टाइप गरिएको, अनुमति दिइएको र मान्य राख्नुहोस्।
मेमोरी हाइजिन : कम्प्याक्ट छोटो अवधिको अवस्था र दीर्घकालीन पुन: प्राप्ति प्रयोग गर्नुहोस्; पूर्ण ट्रान्सक्रिप्टहरू डम्प नगर्नुहोस्।
दुरुपयोग प्रतिरोध : जोखिमपूर्ण कार्यहरूको लागि अनुमति सूची, दर सीमा, अयोग्यता, र "ड्राई-रन" थप्नुहोस्।
परीक्षणयोग्यता : परिदृश्य सुइट (असफलता, अस्पष्टता, इंजेक्शन) कायम राख्नुहोस् र प्रत्येक परिवर्तनमा पुन: चलाउनुहोस्।

🔗 एआई प्रदर्शन कसरी मापन गर्ने
गति, शुद्धता र विश्वसनीयता मापन गर्न व्यावहारिक मेट्रिक्स सिक्नुहोस्।.
🔗 एआईसँग कसरी कुरा गर्ने
राम्रो उत्तरहरू प्राप्त गर्न प्रम्प्टहरू, सन्दर्भ र फलो-अपहरू प्रयोग गर्नुहोस्।.
🔗 एआई मोडेलहरूको मूल्याङ्कन कसरी गर्ने
परीक्षण, रुब्रिक्स, र वास्तविक-विश्व कार्य परिणामहरू प्रयोग गरेर मोडेलहरूको तुलना गर्नुहोस्।.
🔗 एआई मोडेलहरूलाई कसरी अप्टिमाइज गर्ने
ट्युनिङ, काँटछाँट र अनुगमनको साथ गुणस्तर र लागत सुधार गर्नुहोस्।.
१) सामान्य व्यक्तिको भाषामा एआई एजेन्ट भनेको के हो 🧠
एआई एजेन्ट भनेको एउटा लूप हो। ल्याङ्गचेन “एजेन्ट” कागजातहरू
यति नै हो। बीचमा दिमाग भएको लूप।.
इनपुट → सोच्नुहोस् → कार्य → अवलोकन → दोहोर्याउनुहोस् । पुन: कार्य पत्र (कारण + कार्य)
कहाँ:
-
इनपुट भनेको प्रयोगकर्ताको अनुरोध वा कार्यक्रम (नयाँ इमेल, समर्थन टिकट, सेन्सर पिङ) हो।
-
सोच भनेको अर्को चरणको बारेमा तर्क गर्ने भाषा मोडेल हो।
-
ऐनले एउटा उपकरण कल गर्दैछ (आन्तरिक कागजातहरू खोज्नुहोस्, कोड चलाउनुहोस्, टिकट सिर्जना गर्नुहोस्, जवाफ ड्राफ्ट गर्नुहोस्)। ओपनएआई फंक्शन कलिङ गाइड
-
अब्जर्भले टूल आउटपुट पढिरहेको छ।
-
दोहोरिने भागले यसलाई "गफगाफ" को सट्टा "एजेन्टिक" महसुस गराउँछ। LangChain "एजेन्टहरू" कागजातहरू
केही एजेन्टहरू मूलतः स्मार्ट म्याक्रोहरू हुन्। अरूले जुनियर अपरेटर जस्तै काम गर्छन् जसले कार्यहरू मिलाउन सक्छन् र त्रुटिहरूबाट पुन: प्राप्ति गर्न सक्छन्। दुवै महत्त्वपूर्ण छन्।.
साथै, तपाईंलाई पूर्ण स्वायत्तता चाहिँदैन। वास्तवमा... तपाईं सायद यो चाहनुहुन्न 🙃
२) तपाईंले कहिले एजेन्ट बनाउनुपर्छ (र कहिले बनाउनु हुँदैन) 🚦
एजेन्ट बनाउनुहोस् जब:
-
काम बहु-चरणीय र बीचमा के हुन्छ भन्ने आधारमा परिवर्तन हुन्छ।
-
कामको लागि उपकरणको प्रयोग (डाटाबेस, CRM, कोड कार्यान्वयन, फाइल उत्पादन, ब्राउजर, आन्तरिक API)। LangChain “उपकरण” कागजातहरू
-
दोहोर्याउन सकिने परिणामहरू चाहनुहुन्छ , केवल एक-पटक उत्तरहरू होइन।
-
तपाईंले "सम्पन्न" लाई कम्प्युटरले जाँच गर्न सक्ने तरिकाले परिभाषित गर्न सक्नुहुन्छ, खुकुलो रूपमा पनि।.
निम्न अवस्थामा एजेन्ट नबनाउनुहोस्:
-
एउटा साधारण प्रम्प्ट + प्रतिक्रियाले यसलाई समाधान गर्छ (धेरै काम नगर्नुहोस्, पछि तपाईं आफैंलाई घृणा गर्नुहुनेछ)।.
-
तपाईंलाई पूर्ण दृढनिश्चयवाद चाहिन्छ (एजेन्टहरू एकरूप हुन सक्छन्, तर रोबोटिक होइनन्)।.
-
तपाईंसँग जडान गर्न कुनै उपकरण वा डेटा छैन - त्यसो भए यो प्रायः केवल भाइब्स हो।.
स्पष्ट भनौं: "एआई एजेन्ट परियोजनाहरू" मध्ये आधा केही शाखा नियमहरू सहितको कार्यप्रवाह हुन सक्छ। तर हे, कहिलेकाहीँ भाइब पनि महत्त्वपूर्ण हुन्छ 🤷♂️
३) एआई एजेन्टको राम्रो संस्करण के ले बनाउँछ ✅
तपाईंले सोध्नुभएको "राम्रो संस्करण के ले बनाउँछ" खण्ड यहाँ छ, तर म अलि स्पष्ट हुनेछु:
एआई एजेन्टको राम्रो संस्करण होइन जसले सबैभन्दा कडा सोच्दछ। यो त्यो हो जसले:
-
के गर्न अनुमति छ भन्ने थाहा छ (क्षेत्र सीमाहरू)
-
उपकरणहरू भरपर्दो रूपमा प्रयोग गर्दछ (संरचित कलहरू, पुन: प्रयासहरू, टाइमआउटहरू) OpenAI प्रकार्य कलिङ गाइड AWS "टाइमआउटहरू, पुन: प्रयासहरू, र जिटरसँग ब्याकअफ"
-
अवस्थालाई सफा राख्छ (सड्दैन भन्ने मेमोरी) LangChain “मेमोरी सिंहावलोकन”
-
यसको कार्यहरू व्याख्या गर्दछ (लेखा परीक्षण, गोप्य तर्क डम्प होइन) NIST AI RMF 1.0 (विश्वसनीयता र पारदर्शिता)
-
उचित रूपमा रोकिन्छ (समाप्ति जाँच, अधिकतम चरणहरू, वृद्धि) LangChain “एजेन्टहरू” कागजातहरू
-
सुरक्षित रूपमा असफल हुन्छ (मद्दत माग्छ, अधिकारलाई भ्रमित गर्दैन) NIST AI RMF १.०
-
परीक्षणयोग्य छ (तपाईं यसलाई क्यान्ड परिदृश्यहरूमा चलाउन सक्नुहुन्छ र परिणामहरू स्कोर गर्न सक्नुहुन्छ)
यदि तपाईंको एजेन्टको परीक्षण गर्न सकिँदैन भने, यो मूलतः एक धेरै आत्मविश्वासी स्लट मेसिन हो। पार्टीहरूमा रमाइलो, उत्पादनमा भयानक 😬
४) एजेन्टको मुख्य निर्माण तत्वहरू ("शरीर रचना" 🧩)
धेरैजसो ठोस एजेन्टहरूमा यी टुक्राहरू हुन्छन्:
क) नियन्त्रक लूप 🔁
यो अर्केस्ट्रेटर हो:
-
लक्ष्य लिनुहोस्
-
अर्को कार्यको लागि मोडेललाई सोध्नुहोस्
-
चलाउने उपकरण
-
अवलोकन थप्नुहोस्
-
पूरा नभएसम्म दोहोर्याउनुहोस् LangChain “एजेन्ट” कागजातहरू
ख) उपकरणहरू (उर्फ क्षमताहरू) 🧰
उपकरणहरूले एजेन्टलाई प्रभावकारी बनाउँछन्: LangChain “उपकरणहरू” कागजातहरू
-
डाटाबेस प्रश्नहरू
-
इमेल पठाउँदै
-
फाइलहरू तान्दै
-
चलिरहेको कोड
-
आन्तरिक API हरू कल गर्दै
-
स्प्रेडसिट वा CRM मा लेख्दै
ग) स्मृति 🗃️
दुई प्रकारका कुराहरू:
-
अल्पकालीन स्मृति : वर्तमान चलिरहेको सन्दर्भ, हालका चरणहरू, वर्तमान योजना
-
दीर्घकालीन स्मृति : प्रयोगकर्ता प्राथमिकताहरू, परियोजना सन्दर्भ, प्राप्त ज्ञान (प्रायः इम्बेडिङहरू + भेक्टर स्टोर मार्फत) RAG पेपर
घ) योजना र निर्णय नीति 🧭
यदि तपाईंले यसलाई "योजना" भन्नुभएन भने पनि, तपाईंलाई एउटा विधि चाहिन्छ:
-
चेकलिस्टहरू
-
ReAct-शैली "त्यसपछि सोच्नुहोस् उपकरण" ReAct पेपर
-
कार्य ग्राफहरू
-
पर्यवेक्षक-कामदार ढाँचाहरू
-
सुपरभाइजर-वर्कर प्याटर्नहरू माइक्रोसफ्ट अटोजेन (बहु-एजेन्ट फ्रेमवर्क)
ङ) रेलिङ र मूल्याङ्कन 🧯
-
अनुमतिहरू
-
सुरक्षित उपकरण योजनाहरू OpenAI संरचित आउटपुटहरू
-
आउटपुट प्रमाणीकरण
-
चरण सीमाहरू
-
लगिङ
-
NIST AI RMF १.० परीक्षण गर्दछ
हो, यो प्रोत्साहन भन्दा बढी इन्जिनियरिङ हो। जुन... एक प्रकारको कुरा हो।.
५) तुलना तालिका: एजेन्ट निर्माण गर्ने लोकप्रिय तरिकाहरू 🧾
तल एउटा यथार्थपरक "तुलना तालिका" दिइएको छ - केही विशेषताहरू सहित, किनभने वास्तविक टोलीहरू अनौठा हुन्छन् 😄
| उपकरण / फ्रेमवर्क | दर्शक | मूल्य | यो किन काम गर्छ? | नोटहरू (सानो अराजकता) | |
|---|---|---|---|---|---|
| ल्याङ्चेन | लेगो-शैलीका कम्पोनेन्टहरू मन पराउने निर्माणकर्ताहरू | फ्री-इश + इन्फ्रा | उपकरण, मेमोरी, चेनहरूको लागि ठूलो इकोसिस्टम | यदि तपाईंले स्पष्ट रूपमा नाम दिनुभएन भने स्पेगेटी-छिटो हुन सक्छ | |
| लामाइन्डेक्स | RAG-हेभी टोलीहरू | फ्री-इश + इन्फ्रा | बलियो पुन: प्राप्ति ढाँचाहरू, अनुक्रमणिका, कनेक्टरहरू | तपाईंको एजेन्ट मूलतः "खोज + कार्य" गर्ने हुँदा राम्रो हुन्छ... जुन सामान्य कुरा हो | |
| ओपनएआई सहायक शैली दृष्टिकोण | छिटो सेटअप चाहने टोलीहरू | प्रयोगमा आधारित | निर्मित उपकरण कलिङ ढाँचा र रन अवस्था | केही कुनाहरूमा कम लचिलो, तर धेरै एपहरूको लागि सफा | OpenAI ले API OpenAI Assistants फंक्शन कलिङ |
| अर्थपूर्ण कर्नेल | संरचित अर्केस्ट्रेसन चाहने विकासकर्ताहरू | स्वतन्त्र | सीप/कार्यहरूको लागि सफा अमूर्तता | "उद्यम सफा" लाग्छ - कहिलेकाहीँ त्यो प्रशंसा हो 😉 | |
| अटोजेन | बहु-एजेन्ट प्रयोगकर्ताहरू | स्वतन्त्र | एजेन्ट-टु-एजेन्ट सहकार्य ढाँचाहरू | धेरै कुरा गर्न सक्छ; कडा समाप्ति नियमहरू सेट गर्नुहोस् | |
| क्रूएआई | "एजेन्टहरूको टोली" प्रशंसकहरू | स्वतन्त्र | भूमिका + कार्यहरू + हस्तान्तरणहरू व्यक्त गर्न सजिलो छ | कामहरू चिल्लो नभएर कुरकुरा हुँदा राम्रो काम गर्छ | |
| घाँसको ढिस्को | खोज + पाइपलाइन मान्छेहरू | स्वतन्त्र | ठोस पाइपलाइनहरू, पुन: प्राप्ति, घटकहरू | कम "एजेन्ट थिएटर", बढी "व्यावहारिक कारखाना" | |
| आफ्नै रोल गर्नुहोस् (अनुकूलन लूप) | नियन्त्रण गर्ने पागलहरू (मायालु) | तिम्रो समय | न्यूनतम जादू, अधिकतम स्पष्टता | सामान्यतया सबैभन्दा राम्रो दीर्घकालीन... जबसम्म तपाईंले सबै कुरा पुन: आविष्कार गर्नुहुन्न 😅 |
कुनै एकल विजेता छैन। उत्तम छनोट तपाईंको एजेन्टको मुख्य काम पुन: प्राप्ति , उपकरण कार्यान्वयन , बहु-एजेन्ट समन्वय , वा कार्यप्रवाह स्वचालन ।
६) चरणबद्ध रूपमा एआई एजेन्ट कसरी बनाउने (वास्तविक नुस्खा) 🍳🤖
यो भाग धेरैजसो मानिसहरूले छोड्छन्, अनि सोच्छन् किन एजेन्टले पेन्ट्रीमा र्याकुन जस्तो व्यवहार गर्छ।.
चरण १: कामलाई एक वाक्यमा परिभाषित गर्नुहोस् 🎯
उदाहरणहरू:
-
"नीति र टिकट सन्दर्भ प्रयोग गरेर ग्राहकको जवाफको मस्यौदा तयार गर्नुहोस्, त्यसपछि स्वीकृतिको लागि सोध्नुहोस्।"
-
"बग रिपोर्टको अनुसन्धान गर्नुहोस्, यसलाई पुन: उत्पादन गर्नुहोस्, र समाधान प्रस्ताव गर्नुहोस्।"
-
"अपूर्ण बैठक नोटहरूलाई कार्य, मालिक र समयसीमामा परिणत गर्नुहोस्।"
यदि तपाईं यसलाई सरल रूपमा परिभाषित गर्न सक्नुहुन्न भने, तपाईंको एजेन्टले पनि सक्दैन। मेरो मतलब यो गर्न सक्छ, तर यसले सुधार गर्नेछ, र सुधार त्यो हो जहाँ बजेट मर्छ।.
चरण २: स्वायत्तता स्तर (कम, मध्यम, मसालेदार) निर्णय गर्नुहोस् 🌶️
-
कम स्वायत्तता : चरणहरू सुझाव दिन्छ, मानव क्लिकहरूले "अनुमोदन" गर्छन्
-
माध्यम : उपकरणहरू चलाउँछ, आउटपुट ड्राफ्ट गर्छ, अनिश्चिततामा बढ्छ
-
उच्च : ले अन्त्य-देखि-अन्त कार्यान्वयन गर्छ, अपवादहरूमा मात्र मानिसहरूलाई पिंग गर्छ।
तपाईंले चाहेको भन्दा तल सुरु गर्नुहोस्। तपाईं पछि यसलाई सधैं क्र्याङ्क गर्न सक्नुहुन्छ।.
चरण ३: आफ्नो मोडेल रणनीति छान्नुहोस् 🧠
तपाईंले सामान्यतया छनौट गर्नुहुन्छ:
-
सबै कुराको लागि एउटा बलियो मोडेल (सरल)
-
सस्तो चरणहरूको लागि एउटा बलियो मोडेल + सानो मोडेल (वर्गीकरण, मार्ग)
-
आवश्यक परेमा विशेष मोडेलहरू (दृष्टि, कोड, भाषण)
यो पनि निर्णय गर्नुहोस्:
-
अधिकतम टोकनहरू
-
तापक्रम
-
के तपाईं आन्तरिक रूपमा लामो तर्क ट्रेसहरूलाई अनुमति दिनुहुन्छ (तपाईं सक्नुहुन्छ, तर कच्चा विचारको श्रृंखलालाई अन्तिम प्रयोगकर्ताहरूलाई उजागर नगर्नुहोस्)
चरण ४: कडा योजनाहरू सहित उपकरणहरू परिभाषित गर्नुहोस् 🔩
उपकरणहरू निम्न हुनुपर्छ:
-
साँघुरो
-
टाइप गरिएको
-
अनुमति प्राप्त
-
प्रमाणित OpenAI संरचित आउटपुटहरू
do_anything(input: string) भनिने उपकरणको सट्टा , बनाउनुहोस्:
-
search_kb(क्वेरी: स्ट्रिङ) -> नतिजाहरू[] -
टिकट_सिर्जना गर्नुहोस् (शीर्षक: स्ट्रिङ, मुख्य भाग: स्ट्रिङ, प्राथमिकता: enum) -> टिकट_आईडी -
send_email(to: string, subject: string, body: string) -> statusOpenAI प्रकार्य कल गर्ने गाइड
यदि तपाईंले एजेन्टलाई चेनसा दिनुभयो भने, उसले बार हटाएर हेज काट्दा अचम्म नमान्नुहोस्।.
चरण ५: नियन्त्रक लूप बनाउनुहोस् 🔁
न्यूनतम लूप:
-
लक्ष्य + प्रारम्भिक सन्दर्भबाट सुरु गर्नुहोस्
-
मोडेललाई सोध्नुहोस्: "अर्को कार्य?"
-
यदि उपकरण कल - उपकरण कार्यान्वयन गर्नुहोस्
-
अवलोकन थप्नुहोस्
-
रोकिने अवस्था जाँच गर्नुहोस्
-
दोहोर्याउनुहोस् (अधिकतम चरणहरू सहित) LangChain “एजेन्टहरू” कागजातहरू
थप्नुहोस्:
-
टाइमआउटहरू
-
पुन: प्रयासहरू (सावधानीपूर्वक - पुन: प्रयासहरू लुप हुन सक्छन्) AWS “टाइमआउट, पुन: प्रयासहरू, र जिटरको साथ ब्याकअफ”
-
उपकरण त्रुटि ढाँचा (स्पष्ट, संरचित)
चरण ६: ध्यानपूर्वक मेमोरी थप्नुहोस् 🗃️
छोटो अवधि: हरेक चरणमा अद्यावधिक गरिएको कम्प्याक्ट "स्टेट सारांश" राख्नुहोस्। LangChain "मेमोरी सिंहावलोकन"
दीर्घकालीन: टिकाउ तथ्यहरू भण्डारण गर्नुहोस् (प्रयोगकर्ता प्राथमिकताहरू, संगठन नियमहरू, स्थिर कागजातहरू)।
सामान्य नियम:
-
यदि यो बारम्बार परिवर्तन हुन्छ भने - यसलाई छोटो अवधिको लागि राख्नुहोस्
-
यदि यो स्थिर छ भने - लामो समयसम्म भण्डारण गर्नुहोस्
-
यदि यो संवेदनशील छ भने - कम मात्रामा भण्डारण गर्नुहोस् (वा पटक्कै होइन)
चरण ७: प्रमाणीकरण र "आलोचक" पास थप्नुहोस् 🧪
एउटा सस्तो, व्यावहारिक ढाँचा:
-
एजेन्टले परिणाम उत्पन्न गर्छ
-
मान्यकर्ताले संरचना र अवरोधहरू जाँच गर्दछ
-
छुटेका चरणहरू वा नीति उल्लङ्घनहरूको लागि वैकल्पिक आलोचक मोडेल समीक्षाहरू NIST AI RMF 1.0
पूर्ण छैन, तर यसले अचम्मलाग्दो मात्रामा बकवासहरू समात्छ।.
चरण ८: लग इन नगरेकोमा पछुताउनु पर्ने सबै कुराहरू लग गर्नुहोस् 📜
लग:
-
उपकरण कल + इनपुट + आउटपुटहरू
-
गरिएका निर्णयहरू
-
त्रुटिहरू
-
अन्तिम आउटपुटहरू
-
टोकन र विलम्बता ओपनटेलिमेट्री अवलोकनयोग्यता प्राइमर
भविष्य - तिमीले धन्यवाद दिनेछौ। वर्तमान - तिमीले बिर्सनेछौ। त्यो त जीवन हो 😵💫
७) तपाईंको आत्मालाई नतोड्ने उपकरण कलिङ 🧰😵
"एआई एजेन्ट कसरी बनाउने" भन्ने कुरा उपकरण कलिङबाट वास्तविक सफ्टवेयर इन्जिनियरिङ बन्छ।.
उपकरणहरूलाई भरपर्दो बनाउनुहोस् (भरपर्दो राम्रो हो)
भरपर्दो उपकरणहरू हुन्:
-
निर्धारणात्मक
-
दायरा साँघुरो
-
परीक्षण गर्न सजिलो
-
स्ट्राइप "अयोग्य अनुरोधहरू" पुन: चलाउन सुरक्षित छ।
उपकरण तहमा रेलिङहरू थप्नुहोस्, केवल प्रम्प्टहरू मात्र होइन।
प्रम्प्टहरू विनम्र सुझावहरू हुन्। उपकरण प्रमाणीकरण एक बन्द ढोका हो। OpenAI संरचित आउटपुटहरू
गर्नुहोस्:
-
अनुमति सूचीहरू (कुन उपकरणहरू चलाउन सकिन्छ)
-
इनपुट प्रमाणीकरण
-
दर सीमा ओपनएआई दर सीमा गाइड
-
प्रति प्रयोगकर्ता/संस्था अनुमति जाँच
-
जोखिमपूर्ण कार्यहरूको लागि "ड्राई-रन मोड"
आंशिक विफलताको लागि डिजाइन
उपकरणहरू असफल हुन्छन्। नेटवर्कहरू डगमगाउँछन्। प्रमाणीकरणको म्याद सकिन्छ। एजेन्टले निम्न कुराहरू गर्नुपर्छ:
-
त्रुटिहरूको व्याख्या गर्नुहोस्
-
उपयुक्त हुँदा ब्याकअफको साथ पुन: प्रयास गर्नुहोस् गुगल क्लाउड पुन: प्रयास रणनीति (ब्याकअफ + जिटर)
-
वैकल्पिक उपकरणहरू छनौट गर्नुहोस्
-
अड्किएपछि बढाउनुहोस्
एउटा शान्त प्रभावकारी तरिका: संरचित त्रुटिहरू फर्काउनुहोस् जस्तै:
-
प्रकार: auth_error -
प्रकार: फेला परेन -
प्रकार: rate_limited
त्यसैले मोडेलले आत्तिनुको सट्टा बुद्धिमानीपूर्वक प्रतिक्रिया दिन सक्छ।
८) तपाईंलाई सताउनुको सट्टा मद्दत गर्ने सम्झना 👻🗂️
स्मरणशक्ति शक्तिशाली हुन्छ, तर यो रद्दीको दराज पनि बन्न सक्छ।.
छोटो अवधिको स्मृति: यसलाई संकुचित राख्नुहोस्
प्रयोग गर्नुहोस्:
-
अन्तिम N चरणहरू
-
चलिरहेको सारांश (हरेक लूप अद्यावधिक गरिएको)
-
हालको योजना
-
वर्तमान अवरोधहरू (बजेट, समय, नीतिहरू)
यदि तपाईंले सबै कुरालाई सन्दर्भमा फ्याँक्नुभयो भने, तपाईंले पाउनुहुनेछ:
-
बढी लागत
-
ढिलो विलम्बता
-
थप भ्रम (हो, त्यसो भए पनि)
दीर्घकालीन स्मृति: "भरिएको" माथि पुन: प्राप्ति
धेरैजसो "दीर्घकालीन स्मृति" यस प्रकारको हुन्छ:
-
इम्बेडिङहरू
-
भेक्टर स्टोर
-
पुन: प्राप्ति संवर्धित पुस्ता (RAG) RAG पेपर
एजेन्टले सम्झँदैन। यसले रनटाइममा सबैभन्दा सान्दर्भिक स्निपेटहरू पुन: प्राप्त गर्दछ। LlamaIndex “RAG को परिचय”
व्यावहारिक स्मृति नियमहरू
-
"प्राथमिकताहरू" लाई स्पष्ट तथ्यको रूपमा भण्डारण गर्नुहोस्: "प्रयोगकर्तालाई बुलेट सारांश मन पर्छ र इमोजीहरू घृणा गर्छन्" (हाहा, यहाँ होइन 😄)
-
टाइमस्ट्याम्प वा संस्करणहरू सहित "निर्णयहरू" भण्डारण गर्नुहोस् (अन्यथा विरोधाभासहरू थुप्रिन्छन्)
-
साँच्चै आवश्यक परेमा बाहेक कहिल्यै पनि गोप्य कुराहरू नराख्नुहोस्
अनि यहाँ मेरो अपूर्ण रूपक छ: सम्झना फ्रिज जस्तै हो। यदि तपाईंले यसलाई कहिल्यै सफा गर्नुभएन भने, अन्ततः तपाईंको स्यान्डविच प्याज र पछुतो जस्तै स्वादिष्ट हुनेछ।.
९) योजना ढाँचाहरू (सरल देखि फेन्सी सम्म) 🧭✨
योजना भनेको केवल नियन्त्रित विघटन हो। यसलाई रहस्यमय नबनाउनुहोस्।.
ढाँचा A: चेकलिस्ट योजनाकार ✅
-
मोडेलले चरणहरूको सूची आउटपुट गर्दछ
-
चरण-दर-चरण कार्यान्वयन गर्दछ
-
चेकलिस्टको स्थिति अद्यावधिक गर्छ
अनबोर्डिङको लागि उत्कृष्ट। सरल, परीक्षणयोग्य।.
ढाँचा B: ReAct लूप (कारण + कार्य) 🧠→🧰
-
मोडेलले अर्को उपकरण कल निर्णय गर्छ
-
आउटपुट अवलोकन गर्दछ
-
ReAct पेपर दोहोर्याउँछ
यो क्लासिक एजेन्ट अनुभूति हो।.
ढाँचा C: पर्यवेक्षक-कार्यकर्ता 👥
-
सुपरिवेक्षकले लक्ष्यलाई कार्यहरूमा विभाजन गर्छन्
-
कामदारहरूले विशेष कार्यहरू गर्छन्
-
सुपरभाइजरले परिणामहरू मर्ज गर्दछ माइक्रोसफ्ट अटोजेन (बहु-एजेन्ट फ्रेमवर्क)
कार्यहरू समानान्तर गर्न सकिने अवस्थामा वा तपाईं फरक "भूमिका" चाहनुहुन्छ भने यो मूल्यवान हुन्छ जस्तै:
-
अनुसन्धानकर्ता
-
कोडर
-
सम्पादक
-
QA परीक्षक
ढाँचा D: पुन: योजना बनाएर योजना बनाउनुहोस् र त्यसपछि कार्यान्वयन गर्नुहोस् 🔄
-
योजना बनाउनुहोस्
-
कार्यान्वयन गर्नु
-
यदि उपकरणको नतिजाले वास्तविकता परिवर्तन गर्छ भने, पुन: योजना बनाउनुहोस्
यसले एजेन्टलाई जिद्दीपूर्वक खराब योजना पछ्याउनबाट रोक्छ। मानिसहरूले पनि यो गर्छन्, जबसम्म तिनीहरू थकित हुँदैनन्, त्यस्तो अवस्थामा तिनीहरूले पनि खराब योजनाहरू पछ्याउँछन्।.
१०) सुरक्षा, विश्वसनीयता, र जागिरबाट निकालिनु हुँदैन 🔐😅
यदि तपाईंको एजेन्टले कारबाही गर्न सक्छ भने, तपाईंलाई सुरक्षा डिजाइन चाहिन्छ। "हुनु राम्रो" होइन। आवश्यक छ। NIST AI RMF १.०
कडा सीमाहरू
-
प्रति दौड अधिकतम चरणहरू
-
प्रति मिनेट अधिकतम उपकरण कलहरू
-
प्रति सत्र अधिकतम खर्च (टोकन बजेट)
-
अनुमोदन पछाडि प्रतिबन्धित उपकरणहरू
डेटा ह्यान्डलिङ
-
लगिङ गर्नु अघि संवेदनशील इनपुटहरू सम्पादन गर्नुहोस्
-
अलग वातावरण (विकासकर्ता बनाम उत्पादन)
-
न्यूनतम-विशेषाधिकार प्राप्त उपकरण अनुमतिहरू
व्यवहारिक अवरोधहरू
-
एजेन्टलाई आन्तरिक प्रमाणका अंशहरू उद्धृत गर्न बाध्य पार्नुहोस् (बाह्य लिङ्कहरू होइन, केवल आन्तरिक सन्दर्भहरू)
-
आत्मविश्वास कम हुँदा अनिश्चितता झण्डाहरू आवश्यक पर्दछ
-
यदि इनपुटहरू अस्पष्ट छन् भने "स्पष्टीकरण प्रश्न सोध्नुहोस्" आवश्यक छ
भरपर्दो एजेन्ट सबैभन्दा विश्वस्त हुँदैन। यो त्यो हो जसलाई थाहा हुन्छ कि कहिले अनुमान लगाइन्छ... र त्यसो भन्छ।.
११) परीक्षण र मूल्याङ्कन (सबैले बेवास्ता गर्ने भाग) 🧪📏
तपाईंले मापन गर्न नसक्ने कुरालाई सुधार गर्न सक्नुहुन्न। हो, त्यो लाइन मूर्खतापूर्ण छ, तर यो कष्टकर रूपमा सत्य हो।.
परिदृश्य सेट बनाउनुहोस्
३०-१०० परीक्षण केसहरू सिर्जना गर्नुहोस्:
-
खुशीका बाटोहरू
-
किनाराका केसहरू
-
"उपकरण असफल" केसहरू
-
अस्पष्ट अनुरोधहरू
-
प्रतिकूल प्रम्प्टहरू (प्रम्प्ट इंजेक्शन प्रयासहरू) OWASP LLM एपहरूको लागि शीर्ष १० OWASP LLM01 प्रम्प्ट इंजेक्शन
स्कोर परिणामहरू
जस्तै मेट्रिक्स प्रयोग गर्नुहोस्:
-
कार्य सफलता दर
-
पूरा हुने समय
-
उपकरण त्रुटि रिकभरी दर
-
भ्रम दर (प्रमाण बिनाको दावी)
-
मानव स्वीकृति दर (यदि सुपरिवेक्षण गरिएको मोडमा छ भने)
प्रम्प्ट र उपकरणहरूको लागि रिग्रेसन परीक्षणहरू
तपाईंले कुनै पनि समयमा परिवर्तन गर्नुहुन्छ:
-
उपकरण योजना
-
प्रणाली निर्देशनहरू
-
पुन: प्राप्ति तर्क
-
मेमोरी ढाँचा
सुइट फेरि चलाउनुहोस्।
एजेन्टहरू संवेदनशील जनावर हुन्। घरका बिरुवाहरू जस्तै, तर महँगो।.
१२) तपाईंको बजेट नपग्लने डिप्लोयमेन्ट ढाँचाहरू 💸🔥
एउटा सेवाबाट सुरु गर्नुहोस्
-
एजेन्ट नियन्त्रक API
-
यसको पछाडि उपकरण सेवाहरू
-
लगिङ + अनुगमन ओपनटेलिमेट्री अवलोकन योग्यता प्राइमर
लागत नियन्त्रणहरू चाँडै थप्नुहोस्
-
क्यासिङ पुन:प्राप्ति परिणामहरू
-
सारांशहरू सहित कुराकानी अवस्था संकुचित गर्दै
-
राउटिङ र एक्स्ट्र्याक्शनको लागि साना मोडेलहरू प्रयोग गर्दै
-
"गहिरो सोच मोड" लाई कठिन चरणहरूमा सीमित गर्दै
सामान्य वास्तुकला विकल्प
-
स्टेटलेस कन्ट्रोलर + बाह्य स्टेट स्टोर (DB/redis)
-
उपकरण कलहरू सम्भव भएसम्म अयोग्य हुन्छन् स्ट्राइप "अयोग्य अनुरोधहरू"
-
लामो कार्यहरूको लागि लाइन (ताकि तपाईंले वेब अनुरोध सधैंभरि खुला राख्नुहुन्न)
साथै: "किल स्विच" बनाउनुहोस्। तपाईंलाई यसको आवश्यकता पर्दैन जबसम्म तपाईंलाई साँच्चै आवश्यक पर्दैन 😬
१३) समापन नोटहरू - एआई एजेन्ट कसरी बनाउने भन्ने छोटो संस्करण 🎁🤖
यदि तपाईंलाई अरू केही याद छैन भने, यो सम्झनुहोस्:
-
एआई एजेन्ट कसरी बनाउने भन्ने कुरा मुख्यतया मोडेल वरिपरि सुरक्षित लूप निर्माण गर्ने बारे हो। LangChain “एजेन्टहरू” कागजातहरू
-
स्पष्ट लक्ष्य, कम स्वायत्तता, र कडा उपकरणहरूबाट सुरु गर्नुहोस्। OpenAI संरचित आउटपुटहरू
-
अनन्त सन्दर्भ भराई होइन, पुन: प्राप्ति मार्फत मेमोरी थप्नुहोस्। RAG पेपर
-
योजना बनाउनु सरल हुन सक्छ - चेकलिस्ट र पुन: योजना बनाउनु धेरै टाढा जान्छ।.
-
लगिङ र परीक्षणहरूले एजेन्ट अराजकतालाई तपाईंले पठाउन सक्ने चीजमा परिणत गर्दछ। ओपनटेलिमेट्री अवलोकनयोग्यता प्राइमर
-
रेलिङहरू कोडमा पर्छन्, केवल प्रम्प्टहरूमा होइन। LLM एपहरूको लागि OWASP शीर्ष १०
एजेन्ट जादु होइन। यो त्यस्तो प्रणाली हो जसले मूल्यवान हुन पर्याप्त राम्रा निर्णयहरू गर्छ... र क्षति पुर्याउनु अघि नै हार स्वीकार गर्छ। शान्तपूर्वक सान्त्वनादायी, एक तरिकाले 😌
अनि हो, यदि तपाईंले यसलाई सही तरिकाले निर्माण गर्नुभयो भने, यो एक सानो डिजिटल इन्टर्नलाई काममा राख्नु जस्तै महसुस हुन्छ जो कहिल्यै सुत्दैन, कहिलेकाहीं आत्तिन्छ, र कागजी कार्य मन पराउँछ। त्यसैले, मूलतः एक इन्टर्न।.
सोधिने प्रश्न
सरल शब्दमा भन्नु पर्दा एआई एजेन्ट भनेको के हो?
एआई एजेन्ट मूलतः एक लूप हो जुन दोहोरिन्छ: इनपुट लिनुहोस्, अर्को चरण निर्णय गर्नुहोस्, उपकरण प्रयोग गर्नुहोस्, नतिजा पढ्नुहोस्, र यो पूरा नभएसम्म दोहोर्याउनुहोस्। "एजेन्टिक" भाग अभिनय र अवलोकनबाट आउँछ, केवल च्याटिङबाट होइन। धेरै एजेन्टहरू उपकरण पहुँचको साथ केवल स्मार्ट स्वचालन हुन्, जबकि अरूले त्रुटिहरूबाट पुन: प्राप्ति गर्न सक्ने जुनियर अपरेटर जस्तै व्यवहार गर्छन्।.
प्रम्प्ट प्रयोग गर्नुको सट्टा मैले कहिले एआई एजेन्ट निर्माण गर्नुपर्छ?
काम बहु-चरणीय हुँदा, मध्यवर्ती परिणामहरूमा आधारित परिवर्तन हुँदा, र भरपर्दो उपकरण प्रयोग (API, डाटाबेस, टिकटिङ, कोड कार्यान्वयन) आवश्यक पर्दा एजेन्ट बनाउनुहोस्। एजेन्टहरू पनि उपयोगी हुन्छन् जब तपाईं रेलिङहरू र "सम्पन्न" जाँच गर्ने तरिकाको साथ दोहोर्याउन मिल्ने परिणामहरू चाहनुहुन्छ। यदि एक साधारण प्रम्प्ट-प्रतिक्रियाले काम गर्छ भने, एजेन्ट सामान्यतया अनावश्यक ओभरहेड र अतिरिक्त विफलता मोडहरू हुन्छन्।.
म कसरी एउटा एआई एजेन्ट निर्माण गर्न सक्छु जुन लूपहरूमा अड्किएन?
हार्ड स्टप अवस्थाहरू प्रयोग गर्नुहोस्: अधिकतम चरणहरू, अधिकतम उपकरण कलहरू, र स्पष्ट पूर्णता जाँचहरू। संरचित उपकरण योजनाहरू, टाइमआउटहरू, र पुन: प्रयासहरू थप्नुहोस् जुन सधैंभरि पुन: प्रयास गर्दैन। निर्णयहरू र उपकरण आउटपुटहरू लग गर्नुहोस् ताकि तपाईं यो कहाँ पटरीबाट खस्छ भनेर देख्न सक्नुहुन्छ। एक सामान्य सुरक्षा भल्भ एस्केलेसन हो: यदि एजेन्ट अनिश्चित छ वा त्रुटिहरू दोहोर्याउँछ भने, यसले सुधार गर्नुको सट्टा मद्दत माग्नु पर्छ।.
एआई एजेन्ट कसरी बनाउने भन्ने बारे न्यूनतम संरचना कति हो?
कम्तिमा तपाईंलाई एउटा नियन्त्रक लूप चाहिन्छ जसले मोडेललाई लक्ष्य र सन्दर्भ प्रदान गर्दछ, अर्को कार्यको लागि सोध्छ, अनुरोध गरिएको खण्डमा उपकरण कार्यान्वयन गर्दछ, अवलोकन थप्छ, र दोहोर्याउँछ। तपाईंलाई कडा इनपुट/आउटपुट आकारहरू र "सम्पन्न" जाँच भएका उपकरणहरू पनि चाहिन्छ। यदि तपाईंले राज्य सफा राख्नुहुन्छ र चरण सीमाहरू लागू गर्नुहुन्छ भने रोल-योर-ओन लूपले पनि राम्रोसँग काम गर्न सक्छ।.
उत्पादनमा भरपर्दो बनाउन मैले उपकरण कलिङ कसरी डिजाइन गर्नुपर्छ?
उपकरणहरूलाई साँघुरो, टाइप गरिएको, अनुमति दिइएको, र मान्य राख्नुहोस्—जेनेरिक "do_anything" उपकरणबाट बच्नुहोस्। कडा स्किमाहरू (जस्तै संरचित आउटपुटहरू/फंक्शन कलिङ) लाई प्राथमिकता दिनुहोस् ताकि एजेन्टले इनपुटहरूलाई हातले हल्लाउन नसकोस्। उपकरण तहमा अनुमति सूचीहरू, दर सीमाहरू, र प्रयोगकर्ता/संस्था अनुमति जाँचहरू थप्नुहोस्। सम्भव भएसम्म पुन: चलाउन सुरक्षित हुने गरी डिजाइन उपकरणहरू, idempotency ढाँचाहरू प्रयोग गर्नुहोस्।.
एजेन्टलाई नराम्रो नबनाई मेमोरी थप्ने उत्तम तरिका के हो?
मेमोरीलाई दुई भागको रूपमा व्यवहार गर्नुहोस्: छोटो अवधिको रन अवस्था (हालका चरणहरू, हालको योजना, अवरोधहरू) र दीर्घकालीन पुन: प्राप्ति (प्राथमिकताहरू, स्थिर नियमहरू, सान्दर्भिक कागजातहरू)। छोटो अवधिको कम्प्याक्ट चलिरहेको सारांशहरू राख्नुहोस्, पूर्ण ट्रान्सक्रिप्टहरू होइन। दीर्घकालीन मेमोरीको लागि, पुन: प्राप्ति (एम्बेडिंगहरू + भेक्टर स्टोर/RAG ढाँचाहरू) ले सामान्यतया सबै कुरालाई सन्दर्भमा "स्टफिंग" गर्ने र मोडेललाई भ्रमित गर्ने कामलाई हराउँछ।.
मैले कुन योजना ढाँचा प्रयोग गर्नुपर्छ: चेकलिस्ट, ReAct, वा सुपरिवेक्षक-कार्यकर्ता?
कार्यहरू अनुमान गर्न सकिने अवस्थामा र तपाईं परीक्षण गर्न सजिलो कुरा चाहनुहुन्छ भने चेकलिस्ट प्लानर राम्रो हुन्छ। उपकरणको नतिजाले तपाईंले अर्को गर्ने काम परिवर्तन गर्दा ReAct-शैलीका लूपहरू चम्कन्छन्। कार्यहरूलाई समानान्तर गर्न वा फरक भूमिकाहरू (अनुसन्धानकर्ता, कोडर, QA) बाट लाभ उठाउन सकेमा सुपरिवेक्षक-कार्यकर्ता ढाँचाहरू (जस्तै AutoGen-शैली भूमिका विभाजन) ले मद्दत गर्दछ। जिद्दी खराब योजनाहरूबाट बच्नको लागि योजना बनाउनुहोस्-त्यसपछि-कार्यान्वयन गर्नुहोस् एक व्यावहारिक मध्य आधार हो।.
यदि एजेन्टले वास्तविक कारबाही गर्न सक्छ भने म कसरी उसलाई सुरक्षित बनाउन सक्छु?
न्यूनतम-विशेषाधिकार अनुमतिहरू प्रयोग गर्नुहोस् र अनुमोदन वा "ड्राई-रन" मोडहरू पछाडि जोखिमपूर्ण उपकरणहरू प्रतिबन्धित गर्नुहोस्। बजेट र क्याप्स थप्नुहोस्: अधिकतम चरणहरू, अधिकतम खर्च, र प्रति-मिनेट उपकरण कल सीमाहरू। लगिङ गर्नु अघि संवेदनशील डेटा सम्पादन गर्नुहोस्, र उत्पादन वातावरणबाट विकासकर्तालाई अलग गर्नुहोस्। विश्वासले प्रमाणलाई प्रतिस्थापन गर्न दिनुको सट्टा इनपुटहरू अस्पष्ट हुँदा अनिश्चितता झण्डाहरू वा स्पष्टीकरण प्रश्नहरू आवश्यक पर्दछ।.
समयसँगै सुधार होस् भनेर म कसरी एआई एजेन्टको परीक्षण र मूल्याङ्कन गर्न सक्छु?
खुशी मार्गहरू, किनारा केसहरू, उपकरण विफलताहरू, अस्पष्ट अनुरोधहरू, र प्रम्प्ट-इन्जेक्शन प्रयासहरू (OWASP-शैली) सहितको परिदृश्य सुइट बनाउनुहोस्। कार्य सफलता, समय-समय-समाप्ति, उपकरण त्रुटिहरूबाट पुन: प्राप्ति, र प्रमाण बिना दावीहरू जस्ता परिणामहरू स्कोर गर्नुहोस्। तपाईंले उपकरण योजनाहरू, प्रम्प्टहरू, पुन: प्राप्ति, वा मेमोरी ढाँचा परिवर्तन गर्दा, सुइट पुन: चलाउनुहोस्। यदि तपाईंले यसलाई परीक्षण गर्न सक्नुहुन्न भने, तपाईं यसलाई विश्वसनीय रूपमा पठाउन सक्नुहुन्न।.
ढिलाइ र लागत नबढाई म कसरी एजेन्ट तैनाथ गर्न सक्छु?
एउटा सामान्य ढाँचा भनेको बाह्य स्टेट स्टोर (DB/Redis), यसको पछाडि उपकरण सेवाहरू, र बलियो लगिङ/निगरानी (प्रायः OpenTelemetry) भएको स्टेटलेस नियन्त्रक हो। पुन: प्राप्ति क्यासिङ, कम्प्याक्ट स्टेट सारांशहरू, राउटिङ/निकासीका लागि साना मोडेलहरू, र "गहिरो सोच" लाई सबैभन्दा कठिन चरणहरूमा सीमित गरेर लागत नियन्त्रण गर्नुहोस्। लामो कार्यहरूको लागि लाइनहरू प्रयोग गर्नुहोस् ताकि तपाईंले वेब अनुरोधहरू खुला राख्नुहुन्न। सधैं किल स्विच समावेश गर्नुहोस्।.
सन्दर्भ सामग्रीहरू
-
राष्ट्रिय मानक तथा प्रविधि संस्थान (NIST) - NIST AI RMF 1.0 (विश्वसनीयता र पारदर्शिता) - nvlpubs.nist.gov
-
ओपनएआई - संरचित आउटपुटहरू - platform.openai.com
-
OpenAI - प्रकार्य कलिङ गाइड - platform.openai.com
-
ओपनएआई - दर सीमा गाइड - platform.openai.com
-
OpenAI - API चलाउँछ - platform.openai.com
-
ओपनएआई - सहायक फंक्शन कलिङ - platform.openai.com
-
ल्याङ्गचेन - एजेन्ट कागजातहरू (जाभास्क्रिप्ट) - docs.langchain.com
-
LangChain - उपकरण कागजातहरू (पाइथन) - docs.langchain.com
-
ल्याङ्गचेन - मेमोरी सिंहावलोकन - docs.langchain.com
-
arXiv - ReAct पेपर (कारण + कार्य) - arxiv.org
-
arXiv - RAG पेपर - arxiv.org
-
अमेजन वेब सर्भिसेज (AWS) बिल्डर्स लाइब्रेरी - टाइमआउट, पुन: प्रयास, र जिटरको साथ ब्याकअफ - aws.amazon.com
-
ओपनटेलिमेट्री - अवलोकनयोग्यता प्राइमर - opentelemetry.io
-
स्ट्राइप - अदम्य अनुरोधहरू - docs.stripe.com
-
गुगल क्लाउड - पुन: प्रयास रणनीति (ब्याकअफ + जिटर) - docs.cloud.google.com
-
OWASP - ठूला भाषा मोडेल अनुप्रयोगहरूको लागि शीर्ष १० - owasp.org
-
OWASP - LLM01 प्रम्प्ट इन्जेक्सन - genai.owasp.org
-
LlamaIndex - RAG को परिचय - developers.llamaindex.ai
-
माइक्रोसफ्ट - सिमेन्टिक कर्नेल - learn.microsoft.com
-
माइक्रोसफ्ट अटोजेन - बहु-एजेन्ट फ्रेमवर्क (दस्तावेजीकरण) - microsoft.github.io
-
CrewAI - एजेन्ट अवधारणाहरू - docs.crewai.com
-
घाँसको ढिस्को (डीपसेट) - रिट्रिभर्स कागजात - docs.haystack.deepset.ai