Mini Gemini Bootcamp (day02) ep.2
เรามาถึงบทสรุปสุดท้ายของเนื้อหาจากการหลักสูตร Mini Gemini Bootcamp ซึ่งมุ่งเน้นไปที่การเรียนรู้ถึง การเปลี่ยนผ่านจากยุคของ Chatbot ไปสู่ยุคของ Agentic AI ผ่านการใช้งาน Gemini CLI (Command Line Interface) เครื่องมือนี้ช่วยให้ผู้ใช้สามารถสั่งงาน AI ให้ลงมือปฏิบัติการจริงในเครื่องคอมพิวเตอร์ ไม่ว่าจะเป็นการสร้างฐานข้อมูล การติดตั้งซอฟต์แวร์ หรือการเชื่อมต่อกับบริการภายนอกผ่านโปรโตคอล MCP (Model Context Protocol)
ประเด็นสำคัญที่ถูกเน้นย้ำคือ AI ในปัจจุบันเปรียบเสมือน "Dream Machine" ที่สามารถเปลี่ยนความคิดให้เป็นผลงานได้ทันทีหากผู้ใช้สามารถอธิบายกระบวนการได้อย่างชัดเจน หัวใจสำคัญของการทำงานในยุคใหม่คือการบริหารจัดการ "Token" และการใช้โครงสร้างแบบ Project-based เพื่อให้ AI มีบริบท (Context) ที่แม่นยำที่สุดในการทำงานแต่ละประเภท
พลังของ Agentic AI
เมื่อ AI ไม่ได้เป็นแค่ Chatbot แต่เปลี่ยนเป็น "Dream Machine" เรากำลังยืนอยู่บนรอยต่อของประวัติศาสตร์เทคโนโลยีที่น่าตื่นเต้นที่สุด เพราะเรากำลังก้าวข้ามยุคของการแค่ "ถาม-ตอบ" ไปสู่ยุคของ "การสั่งงานและลงมือทำ" อย่างเต็มรูปแบบ AI ในวันนี้ไม่ใช่แค่คู่สนทนา แต่เป็น "Dream Machine" (เครื่องจักรแห่งความฝัน) ที่พร้อมจะเปลี่ยนไอเดียในหัวของคุณให้กลายเป็นความจริงได้ในพริบตา
Chatbot ทั่วไป vs. AI Agent (The Great Paradigm Shift)
เพื่อให้เห็นภาพชัดเจนว่าทำไมเราถึงต้องตื่นเต้นกับสิ่งนี้ มาดูความแตกต่างระหว่าง Chatbot แบบเดิมที่คุ้นเคย กับ AI Agent ที่เปรียบเสมือนเพื่อนร่วมงานอัจฉริยะผ่านตารางนี้กัน
| หัวข้อวิเคราะห์ | Chatbot แบบเดิม (Traditional Chatbot) | AI Agent (Agentic AI) |
|---|---|---|
| การตอบสนอง (Response) | เน้นการตอบคำถามตามข้อมูลที่มี (Passive) | เน้นการแก้ปัญหาและบรรลุเป้าหมาย (Proactive) |
| ความสามารถ (Action) | ทำได้เพียงแค่ "พูด" หรือ "เขียน" ข้อความ | สามารถ "ลงมือทำ" เช่น สร้างไฟล์, รันโค้ด, ต่อ Database |
| ความจำ (Context/Memory) | จำได้แค่บทสนทนาล่าสุด (Short-term) | มีระบบหน่วยความจำระดับโปรเจกต์ และจำความชอบส่วนตัวได้ |
| เป้าหมาย (Goal) | ตอบคำถามให้จบเป็นครั้งๆ ไป | ทำงานจนกว่า "ภารกิจ" จะสำเร็จ (Objective-driven) |
💡 So What? นี่คือการเปลี่ยนกระบวนทัศน์ (Paradigm Shift) ครั้งใหญ่ จากเดิมที่เราต้องลงมือทำเองทุกขั้นตอน AI Agent จะเปลี่ยนบทบาทมนุษย์จาก "คนทำงาน" (Doer) ให้กลายเป็น "ผู้ออกคำสั่งและผู้ตรวจทาน" (Director & Reviewer) ซึ่งช่วยขยายขีดความสามารถของเราให้ไร้ขีดจำกัด
หัวใจของ Agentic AI: แนวคิด 'Reason and Act' (ReAct)
Agentic AI ไม่ได้ทำงานแบบสุ่ม แต่มันมีกระบวนการคิดที่เป็นตรรกะที่เรียกว่า ReAct (Reason + Act) และที่สำคัญคือต้องมีการ "วางแผน" ก่อนเริ่มงานเสมอ โดยมีขั้นตอนดังนี้:
- Understand: วิเคราะห์คำสั่ง (Prompt) อย่างลึกซึ้ง
- Plan (สำคัญมาก!): ก่อนจะลงมือทำ AI จะเข้าสู่ Plan Mode (ผ่านคำสั่ง /plan หรือ "Enter Plan mode") เพื่อออกแบบโครงสร้างงาน (Architecture) และขั้นตอนทั้งหมดอย่างเป็นระบบ
- Reason: คิดวิเคราะห์ในแต่ละขั้นตอนว่าต้องใช้เครื่องมืออะไร
- Act: ตัดสินใจเรียกใช้เครื่องมือ (Tools) เช่น การรันคำสั่ง Shell หรือการเขียนโค้ดเพื่อให้เกิดผลลัพธ์จริง
หัวใจสำคัญที่ทำให้ AI ยุคนี้แตกต่างคือแนวคิด React (Reason + Act) หรือการที่ AI สามารถ “ตกผลึกทางความคิด” แล้ว “ลงมือปฏิบัติ” ได้ทันที ในโลกของ Agentic AI มันไม่ได้แค่ "บอก" วิธีทำ แต่เริ่ม "ลงมือ" ให้เราทันที
ตัวอย่างที่ชัดเจนที่สุดคือการสร้างระบบฐานข้อมูล (Database) อย่าง burger.db แทนที่จะต้องมานั่งเขียน Code เอง เราเพียงแค่สั่งด้วยภาษาธรรมชาติ AI จะทำการวิเคราะห์ (Reason) และตรวจสอบก่อนว่าในเครื่องเรามีซอฟต์แวร์ที่จำเป็นหรือไม่ ซึ่งถ้าเครื่องเราไม่มีโปรแกรมอย่าง R หรือ Python ติดตั้งอยู่ AI สามารถขออนุญาตใช้คำสั่ง sudo เพื่อ ติดตั้ง (Act) ซอฟต์แวร์เหล่านั้นให้เราได้เองในทันที
ในกระบวนการนี้ยังมีระบบ Interactive Shell (Human-in-the-loop) ที่ AI จะสื่อสารกับเราตลอด เช่น เมื่อต้องใส่รหัสผ่านเพื่อติดตั้งโปรแกรม มันจะขึ้นสถานะ tab to focus เพื่อให้เรากรอก Password ได้อย่างปลอดภัย นี่คือการทำงานร่วมกันอย่างแท้จริง
นอกจากนี้ ในการทำงานระดับโปร Gemini จะมี "Sub-Agents" หรือลูกน้องมือโปรคอยช่วยคุณ เช่น:
- Generalist Agent: เก่งเรื่องงานซ้ำๆ (Batch Processing) เช่น เขียนโพสต์โซเชียล 30 วันรวด
- Code Base Investigator: นักสืบโค้ด คอยหาบั๊กและวิเคราะห์โครงสร้างโปรแกรม
- CLI Helper: ผู้ช่วยส่วนตัวที่จะตอบทุกคำถามเกี่ยวกับการใช้คำสั่ง CLI
เริ่มต้นโปรเจกต์ด้วย /init: การสร้าง 'สมอง' ของงาน
ขั้นตอนแรกที่สำคัญที่สุดเมื่อเปิดโฟลเดอร์งานใหม่คือคำสั่ง /init (Initialization) เพื่อสร้างรากฐานความเข้าใจให้กับ AI ไฟล์ gemini.md หัวใจที่ AI ต้องอ่านก่อนเสมอ เมื่อคุณรันคำสั่ง /init ระบบจะสร้างไฟล์ gemini.md ขึ้นมา นี่คือ "ไฟล์สมอง" และเป็น ไฟล์แรกที่ Gemini จะวิ่งมาอ่านทุกครั้ง เมื่อคุณเปิดโปรเจกต์ เพื่อให้มั่นใจว่ามันเข้าใจบริบทงานปัจจุบันแม้คุณจะทิ้งงานไปหลายวันก็ตาม
3 สิ่งสำคัญที่ gemini.md เก็บไว้:
- Project Structure: โครงสร้างไฟล์ทั้งหมดในโปรเจกต์
- Technical Specs: รายละเอียดทางเทคนิคและสเปกของงาน
- Objectives: เป้าหมายหลักที่คุณต้องการบรรลุในโปรเจกต์นี้
การปรับแต่งบริบทส่วนตัวด้วย /memory
เพื่อให้ AI ตอบสนองได้ตรงใจเหมือนเพื่อนสนิทที่รู้ใจคุณที่สุด เราสามารถป้อน Personal Context ผ่านคำสั่ง /memory add ซึ่งจะทำหน้าที่เหมือนฟีเจอร์ Memory ใน Web App
ตัวอย่างการพิมพ์คำสั่ง:
/memory add My name is Brian, I am from Korea, and I love McDonald's.
ตารางเปรียบเทียบพลังของ Memory
| สถานะ | การตอบสนองของ AI | ตัวอย่างผลลัพธ์ |
|---|---|---|
| ก่อนมี Memory | ตอบตามข้อมูลทั่วไป ไม่รู้ว่าคุณเป็นใคร | "สวัสดีครับ มีอะไรให้ช่วยไหมครับ?" |
| หลังมี Memory | ปรับเนื้อหาให้เข้ากับตัวตนและความชอบของคุณ | "สวัสดีครับ Brian! วันนี้รับเมนูเบอร์เกอร์ใหม่จาก McDonald's ไปทานระหว่างวางแผนโปรเจกต์ที่เกาหลีไหมครับ?" |
การตรวจสอบสถานะและบริหารจัดการทรัพยากร (/stat & /footer)
การใช้งานอย่างมือโปรต้องรู้จักบริหาร "งบประมาณ" การใช้งาน ด้วย 2 เครื่องมือหลัก:
/stat: ตรวจสอบโควต้าใช้งาน
คำสั่งนี้จะบอกว่าคุณเหลือ "กระสุน" ในการสั่งการเท่าไหร่ในแต่ละวัน:
- Free Users: 1,000 Requests ต่อวัน
- Pro Users: 1,500 Requests ต่อวัน (เพิ่มขึ้นถึง 50%!)
- ระบบจะบอกเวลาที่ชัดเจนว่าโควต้าจะรีเซ็ตใหม่ในอีกกี่ชั่วโมง
/footer: ปรับแต่งแถบสถานะ (The Dashboard)
คุณสามารถเลือกสิ่งที่ต้องการเห็นที่ท้ายหน้าจอได้ เพื่อช่วยในการตัดสินใจ:
| ข้อมูลใน Footer | ประโยชน์สำหรับมือใหม่ |
|---|---|
| Workspace | มั่นใจว่า AI กำลังทำงานถูกโฟลเดอร์ ไม่ไปลบไฟล์งานอื่น |
| Model Name | เช็คว่าใช้รุ่น Flash (เร็ว/ประหยัด) หรือ Pro (ฉลาดล้ำ) |
| Context Usage | ดูว่าข้อมูลที่คุยกันเริ่ม "ล้น" ความจำหรือยัง |
| Token Count | เห็นต้นทุนที่ใช้ไปในแต่ละคำสั่งแบบ Real-time |
เมื่อเราใช้งานไปสักพัก ข้อมูลบทสนทนาจะเริ่มหนาแน่น ซึ่งส่งผลต่อ 'งบประมาณ (Token)' ของเรา
การบริหาร 'งบประมาณ Token' ด้วย /compress
ในโลกของ Agentic AI "Token คือเงิน" และการบริหาร Token คือทักษะที่จะช่วยให้คุณมี "100x Productivity" ยิ่งบทสนทนายาว AI ยิ่งต้องแบกประวัติเยอะ ทำให้เปลือง Token และทำงานช้าลง
คำสั่ง /compress คือการ "Zip" หรือบีบอัดประวัติการแชท โดยสรุปเฉพาะใจความสำคัญที่จำเป็นต่อการทำงานต่อไว้ ทำให้ประหยัดงบในกระเป๋าได้มหาศาล
ตัวอย่างประสิทธิภาพจากประสบการณ์จริง:
- ก่อนบีบอัด: 19,000 Tokens (เริ่มอืดและแพง)
- หลังบีบอัด: เหลือเพียง 1,700 Tokens (ประหยัดไปกว่า 10 เท่า!)
การบันทึกและจัดการบทสนทนา (/chat)
เมื่อคุณปั้นโปรเจกต์จนได้ผลลัพธ์เรียบร้อย อย่าลืมจัดการมันด้วยคำสั่งเหล่านี้:
/chat save: สร้าง Checkpoint เหมือนในเกม เพื่อกลับมาเริ่มใหม่ที่จุดนี้ได้เสมอ/chat share: บันทึกบทสนทนาออกมาเป็นไฟล์.mdเพื่อนำไปใช้งานต่อหรือส่งต่อให้ทีม- YOLO Mode (
Ctrl + Y): สำหรับผู้ที่เริ่มชำนาญ คุณสามารถเปิดโหมด "You Only Live Once" เพื่อให้ AI ตัดสินใจทำงานโดยไม่ต้องขออนุญาตคุณซ้ำซ้อน (Human-in-the-loop แบบรวดเร็ว)
สิ่งที่มือใหม่ควรลองทำ (Checkpoint List):
- ลองรัน
/initเพื่อสร้างสมองให้โฟลเดอร์งาน - ลองใช้
/memory addแนะนำตัวตนของคุณ (ชื่อ, ความชอบ, งานที่ทำ) - ลองรัน
/statเพื่อดูโควต้าคงเหลือของวันนี้ (คุณมี 1,000 หรือ 1,500?) - ลองใช้
/chat shareบันทึกแชทแรกออกมาเป็นไฟล์ .md
สรุปตารางคำสั่งด่วน (Quick Reference Table)
| คำสั่ง | หน้าที่หลัก | เมื่อไหร่ที่ควรใช้ |
|---|---|---|
/init |
วิเคราะห์โปรเจกต์และสร้าง gemini.md | ก้าวแรกของทุกโปรเจกต์ใหม่ |
/memory add |
เพิ่มข้อมูลส่วนตัว (Personal Context) | เมื่อต้องการให้ AI รู้ใจเราเหมือนเพื่อน |
/stat |
ดู Request คงเหลือและเวลา Reset | เมื่อต้องการวางแผนการใช้งานให้คุ้มค่า |
/footer |
ปรับแต่งแถบสถานะด้านล่าง | เมื่อต้องการตรวจสอบ Model หรือ Token สดๆ |
/compress |
สรุปและย่อประวัติเพื่อประหยัด Token | เมื่อแชทเริ่มยาวหรือ AI เริ่มตอบช้า |
/chat save/share |
บันทึก Checkpoint หรือส่งออกไฟล์ | เมื่อได้ผลลัพธ์ที่ต้องการและอยากเก็บไว้ |
/help |
แสดงรายการคำสั่งทั้งหมด | เมื่อจำชื่อคำสั่งไม่ได้ หรืออยากค้นหาฟีเจอร์ใหม่ |
"No Token, No Work - บริหาร Token ให้ดี แล้ว AI จะขยับพลังการผลิตของคุณไปสู่ระดับ 100x"
Model Context Protocol (MCP)
MCP คือโปรโตคอลที่ทำหน้าที่เป็นเลเยอร์การสื่อสารระหว่าง Gemini CLI และบริการภายนอก เปรียบเสมือนการเชื่อมต่อ USB ระหว่างคอมพิวเตอร์สองเครื่อง
- หลักการทำงาน: MCP ช่วยให้ AI สามารถเรียกใช้เครื่องมือ (Tools) ของแพลตฟอร์มอื่นได้โดยตรงโดยไม่ต้องเขียนโค้ด API ที่ซับซ้อน
- ตัวอย่างการใช้งานจริง:
- WordPress MCP: สั่งให้เขียนบทความแบบ Draft และอัปโหลดขึ้นเว็บไซต์ได้ทันทีจาก CLI
- Canva MCP: สั่งให้ออกแบบ Social Media Post โดยระบุขนาด สัดส่วน และข้อความที่ต้องการ AI จะสร้างดีไซน์และส่งลิงก์ผลงานกลับมาให้
- Notion MCP: ใช้สำหรับดึงข้อมูลหรืออัปเดตฐานข้อมูลใน Notion ได้โดยตรง
| เครื่องมือ (Tool) | ความสามารถ (Capability) | หมายเหตุการใช้งาน (Operational Note) |
|---|---|---|
| Google Search | ค้นหาข้อมูล Real-time | เหมาะสำหรับการอัปเดตข้อมูลปัจจุบัน |
| Web Fetch | ดึงข้อมูลจาก URL | ใช้สำหรับดึงบทสรุปหรือเนื้อหาจากเว็บไซต์เฉพาะ |
| Shell Run | รันคำสั่งคอมพิวเตอร์ | ใช้ติดตั้งซอฟต์แวร์หรือจัดการไฟล์ระบบ |
| Notion MCP | จัดการ Database/Page | ดึงข้อมูลหรืออัปเดต Page ผ่านภาษาธรรมชาติ |
| WordPress MCP | จัดการเนื้อหาเว็บไซต์ | สร้าง Draft หรือ Publish โพสต์ (ต้องใช้ Authentication) |
| Canva MCP | งานกราฟิกดีไซน์ | สร้างดีไซน์ตามขนาดที่ระบุ (ต้องเปิด URL ยืนยันสิทธิ์) |
บทสรุปและโร้ดแมปการดำเนินงาน (Implementation Roadmap)
ยุคแห่ง Agentic AI ไม่ใช่การรอคอยอนาคต แต่คือการสร้างความได้เปรียบตั้งแต่วันนี้ เปลี่ยนจากผู้ใช้แชทบอทไปสู่การเป็นผู้กำกับดูแลระบบอัตโนมัติ
Roadmap การดำเนินงาน:
- Phase 1: Environment Setup – ติดตั้ง Gemini CLI และตั้งค่ามาตรฐานความปลอดภัย
- Phase 2: Project Architecture – กำหนด Spec งานผ่าน /init และ gemini.md
- Phase 3: Contextualization – ตั้งค่าบริบทระดับ Global และ Project ผ่าน /memory
- Phase 4: Ecosystem Integration – เชื่อมต่อ MCP Server เข้ากับ Notion, WordPress และบริการหลักอื่นๆ
- Phase 5: Autonomous Operations – ปรับใช้ /plan mode สำหรับการทำงานอัตโนมัติภายใต้การควบคุม
- Phase 6: Skill Development – สร้างแหล่งข้อมูลทักษะ AI (Skill Library) เฉพาะเพื่อความยั่งยืน
หมายเหตุโครงสร้างไฟล์ตัวอย่าง (gemini.md):
- Project Spec: Enterprise Integration
- Status: Development V2.0 Core
- Objective: Build scalable lead-gen via MCP Technical
- Stack: Serverless, Cloudflare, WordPress MCP
AI คือ Dream Machine ที่ทรงพลัง ขีดจำกัดเพียงอย่างเดียวที่เหลืออยู่คือจินตนาการและความสามารถในการบริหารจัดการของผู้สั่งงาน

Comments