MINI Gemini bootcamp [ Day 2.2] เรียนรู้ AI ในวันปิดเทอม

หลังจากบทความก่อนหน้า ✍️ From FC to Bootcamp: My Gemini CLI Story และ Mini Gemini Bootcamp [Day 2] ในวันนี้ผมก็ได้เรียนย้อนหลังได้ครบใน Day 2 จึงจะขอรวบรวมความรู้ที่เหลือจาก Day 2 มาเพิ่มเติมให้คุณผู้อ่านได้เรียนรู้ไปพร้อม ๆ กันนะครับ

ขอเริ่มด้วยคำพูดที่สะกดความสนใจของผมจากคลาสนี้ของแอดทอยที่ว่า

AI = Dream Machine : ถ้าเราคิดได้ AI ทำได้ แต่ถ้าเราคิดไม่ได้ AI ก็ทำไม่ได้

คำพูดนี้สะกดความสนใจของผมอย่างไร ผมขออธิบายในประเด็นแรกว่าการที่บอกว่า AI เป็นเครื่องจักรแห่งความฝัน เมื่อผมได้ยินปุ๊ปแรงขับภายในใจที่อยากเรียนรู้ ซึ่งไม่รู้มาจากไหนกลับเต็มเปี่ยมด้วยความสนใจ ความอยากที่จะสร้างความฝันที่อยู่ในหัวหลาย ๆ อย่างให้ออกมาเป็นแรงผลักดันให้การเรียนรู้วันนี้ผมมีจิตใจจดจ่ออย่างมาก และแถมท้ายที่ว่า AI จะทำในสิ่งที่เราคิดได้ หรือก็คือคนใช้ AI เก่งแค่ไหน AI ก็จะเก่งเท่าคนที่ใช้มัน ก็เลยเป็นอีกเหตุหนึ่งที่เราอย่างเก่งขึ้น พัฒนาขึ้น เพื่อให้สามารถใช้ AI ได้อย่างเก่งขึ้น ซึ่งทั้งหมดนี้จึงเป็นแรงขับภายในที่ทำให้วันนี้แม้ว่าสภาพอากาศจะร้อนขนาดไหน ผมก็ขอเรียนรู้ AI ให้ได้มากขึ้น

สาธยายความรู้สึกมาเยอะขอเข้าเรื่องเลยนะครับ จากบทความครั้งที่แล้วที่ยุคของ AI ก้าวผ่านจากยุค Chat bot มาสู่ยุค Agentic AI ซึ่ง Agentic นี่แหละคือ อนาคต Agentic The Future ซึ่งในอนาคตนี้ AI จะเป็น Agent ที่มีความสามารถในการคิดและทำให้เรา ดังนั้นในยุคใหม่นี้การใช้ AI เราจะต้องคิดเยอะ ๆ คิด ๆ คิดว่าจะสร้างหรือจะทำอะไรดี AI จะรอคำสั่งของเรา เราเก่งแค่ไหน AI ย่อมเก่งแค่นั้นจริง ๆ

Sub-Agents

Agent เป็นเครื่องมือใน cli ที่เราเรียกใช้งาน ซึ่งมีมากมายที่ AI จะเลือกใช้ให้เหมาะสมกับงานที่เราสั่ง นอกจากนี้ยังมีในส่วนของ Sub-Agents ที่ขอแนะนำตัวแรกคือ generalist Agent โดยเมื่อเราจะเรียกใช้แค่พิมพ์ @generalist [Agent] ซึ่งแอดได้ให้ฉายาว่า เป็ดโปร 🐥 เอ? แล้วเป็นเป็ดโปรอย่างไร สารภาพก่อนนะครับในใจคิดถึงชื่อยี่ห้อน้ำยาล้างห้องน้ำ 555+ มาเข้าเรื่องกันต่อนะครับ เป็ดโปรนี้คือความสามารถที่ Agent นี้ใช้ในการทำงานที่ทำซ้ำ ๆ เป็นการทำงานพร้อม ๆ กันหลาย ๆ ตัว รวมพลกันแล้วแสดงผลลัพธ์นั้นออกมา เช่น ค้นหาข้อมูลซ้ำ ๆ เขียนบทความซ้ำ ๆ อะไรที่ทำแล้วน่าเบื่อ ๆ ทำซ้ำ ๆ เรียกหา เป็ดโปร อย่าง generalist ได้เลย ซึ่งเราสามารถประยุกต์ใช้ในงานที่ซ้ำ ๆ อย่างที่ผมเล่ามาแล้ว และมีตัวอย่างที่เพื่อนในคลาสได้ยกตัวอย่างได้น่าสนใจคือ ใช้วิเคราะห์คู่แข่งในตลาด ซึ่งถ้าเราประยุกต์ได้ก็ช่วยให้งานเราดีขึ้นเลยครับ

การบริหารจัดการ Token

1 prompt ≠ 1 request

การใช้ AI โดยเฉพาะการใช้เวอร์ชันฟรีนั้นมีข้อจำกัดโดยเฉพาะโควตาของ request ที่จำกัดไว้ที่ 1000 requests ต่อวัน ซึ่งทำให้เราต้องบริหารจัดการให้ดี และเราอาจเข้าใจผิดว่า 1 คำสั่ง เท่ากับ 1 request ซึ่งไม่เสมอไปครับ เพราะหากคำสั่งนั้นยากซับซ้อนมาก AI ต้องคิดมากเราอาจถูกเบิร์นมากกว่า 1 request ก็เป็นไปได้ และที่สำคัญแนะนำให้เขียน prompt เป็นภาษาอังกฤษเพราะหากใช้เป็นภาษาไทยอาจถูกเบิร์น token มากกว่าภาษาอังกฤษเป็น 2 เท่า ซึ่งในอนาคตนั้นทักษะหรือ skill ที่สำคัญที่เราต้องเรียนรู้และจัดการคือ ทักษะการบริหาร Budget ซึ่ง Budget ในที่นี้ไม่ใช่เพียงแค่ Money เพียงอย่างเดียวกลับเป็น Token ด้วย คนที่มี Token เยอะก็สามารถทำงานได้มากกว่าคนที่มี Token น้อย ดังนั้น เราจึงต้องรู้จักที่จะบริหารจัดการนอกจากเงินแล้ว Token ก็เตรียมวางแผนการใช้ไม่แพ้กัน โดยต่อไปข้างหน้าเราจะเกิดวัฎจักร Token คือ เราพยายามหาเงินให้ได้มากเพื่อซื้อ token เพื่อมาช่วยให้การทำงานได้ประสิทธิภาพมากขึ้นเรื่อย ๆ และเมื่ออยากได้รายได้มาก ๆ เราก็ต้องใช้ token ในการทำงานมาก และถ้าเราอยากได้ token มาก เราก็ต้องทำงานหาเงินมาก ๆ ซึ่งวนเป็นวัฎจักรแบบนี้เรื่อยไป ดังนั้นการบริหารจัดการในชีวิตของเราก็จะต้องจัดการการใช้ Token ด้วย

No token, No work

การทำงานควรเริ่มจากการวางแผน

การทำงานไม่ว่าจะเป็นงานใด ๆ ควรเริ่มจากการวางแผน ไม่ใช่อยู่ ๆ เราเริ่มงานโดยไม่วางแผนไว้ก่อนผลลัพธ์อาจเกิดได้แต่อาจไม่สมบูรณ์แบบตามที่เราต้องการ ก็เช่นกันใน cli เราสามารถที่จะให้ AI ช่วยวางแผนได้ด้วยการใช้ /plan ซึ่งก็คือ plan mode นั่นเอง เพราะ gemini จะทำงานได้ดีขึ้นแล้วเรายังได้เห็นการวางแผนของ AI ที่เราจะทำงานร่วมกัน ซึ่งในการใช้งานเราก็สามารถใช้งาน Plan Mode ด้วยการพิมพ์ Let's Plan หรือ Enter Plan Mode: ก็ได้

Skill สร้างไว้สำหรับใช้งาน

/Skill list เป็นอีกหนึ่งเครื่องมือที่ทำหน้าที่เหมือนกับ Generator คือทุกครั้งที่เราคุยเรี่องนี้แล้วเราจะเรียก skill นี้ออกมาใช้ได้อย่างง่ายดาย ในการสร้าง Skill นั้นเราควรคิดไว้ว่า Skill นี้ใช้ทำอะไร ใครเป็นคนใช้ (Input) ผลลัพธ์ออกมาเป็นแบบไหน (output) มีตัวอย่างให้ดูได้ไหม (Format) ง่าย ๆ ให้เราถามว่า "ใช้ทำอะไร ใช้เมื่อไหร่ ใช้เพื่ออะไร" แค่นี้เราก็ได้ skill สำหรับเป็นผู้ช่วยในการใช้งานแล้ว เมื่อสร้าง skill แล้วเราใช้ /skillsreloadเพื่อเริ่มใช้งาน

MCP ตัวเชื่อมความสามารถให้กับ Agent

MCP : Model Content Protocall คือการเพิ่มความสามารถให้กับ Agent ให้สามารถทำงานได้มากขึ้น ถ้าให้นึกภาพว่าถ้าหากเครื่องคอมพ์เราอยากเพิ่มความสามารถแล้วเราใช้สาย USB เชื่อมต่อเครื่องคอมพ์ 2 เครื่องเข้าหากัน แล้วแลกเปลี่ยนข้อมูลหากันได้ เรียกใช้ข้อมูลของกันได้ มันคือการเพิ่มขีดความสามารถได้เป็นอย่างดี โดย MCP นั้นจะเป็น Layer การสื่อสารที่คั่นกลางระหว่าง MCP Clients กับ Public API ทำให้สามารถเชื่อมต่อ cli กับ sever ของ sevice ที่เราใช้งานได้อย่างง่ายโดยเพียงแค่ใช้คำสั่ง prompt ด้วยภาษาธรรมชาติก็ได้รับผลงานที่เราต้องการแล้ว ซึ่งการใช้งานก็สามารถเข้าไปที่ gemini cli extention gemini.com/extensions แล้วเราก็เลือก mcp ai agent ที่เราต้องการใช้งานเพื่อเริ่มทำงาน MCP ช่วยให้การเขียนโค้ดยาก ๆ กลับกลายเป็นผู้ใช้งานสามารถคุยกับ API ด้วยภาษาธรรมชาติได้

แม้ว่าการเรียนรู้ในวันที่สองนี้จะจบไป แต่ก็มีอีกหลายทักษะที่ผมจะต้องเรียนรู้และพัฒนาตนเองเพื่อให้ทันกับยุค AI Agent และทำให้ตัวเองเป็น Pro User พร้อมใช้พลังงานจาก AI สร้างสิ่งที่ผมฝันให้เกิดขึ้นได้จริง ๆ

Sub-Agents

การบริหารจัดการ Token

การทำงานควรเริ่มจากการวางแผน

Skill สร้างไว้สำหรับใช้งาน

MCP ตัวเชื่อมความสามารถให้กับ Agent

Comments