ปลดล็อกพลังของ AI : สรุปจาก Mini Gemini Bootcamp Day1-2

ทุกวันนี้โลกหมุนไว และ AI ก็เก่งขึ้นทุกวันจนตามไม่ทัน อยากใช้ประโยชน์จาก AI ให้ได้มากที่สุด แต่ก็ไม่รู้ว่าจะเอาไปใช้ทำอะไรบ้าง หรือแม้กระทั่ง AI สามารถช่วยเราเข้าไปทำงานบน third party app หรือ website ได้หรือเปล่า ใน Mini Gemini Bootcamp ของคุณทอย Datarockie มีคำตอบค่ะ โพสต์แรกนี้จึงขอเปิดประเดิมด้วยสรุปสิ่งที่ได้เรียนรู้จาก Mini Gemini Bootcamp (Day1-2) กันค่ะ

เริ่มต้นด้วย AI คืออะไร AI คือเครื่องมือที่เรียนรู้ได้และเก่งขึ้นทุกวัน แต่เราที่เป็นมนุษย์กลับไถมือถือทุกวันซึ่งไม่ได้ทำให้ตัวเองเก่งขึ้นเลย หนึ่งดอกโดนเราจังๆ T^T

AI มันจะเก่งเท่าสกิลของคนใช้ ต่อให้เราใช้ AI ตัวเดียวกับ Dev ระดับโลก แต่ถ้าเราไม่มีสกิลพอเราก็ทำได้ไม่เท่าเขาอยู่ดี เปรียบเสมือนกล้องราคาแพง ถ้าอยู่ในมือคนที่ใช้ไม่เป็น ภาพก็คงจะไม่สวยอยู่ดี หรืออุปกรณ์ศิลปะที่ราคาแพง ถ้าอยู่ในมือคนที่วาดรูปไม่เป็น ใช้สีไม่เป็น ก็อาจจะได้ภาพที่แย่กว่าคนเก่งที่ใช้แค่สีไม้ธรรมดาก็ได้

ไม่ต่างอะไรกับ AI ที่ถ้าเรายิ่ง prompt ได้ดีเท่าไร ก็จะยิ่งได้ผลลัพธ์ที่ดีขึ้นเท่านั้น ยิ่งเราเก่งพอที่จะรีวิวงานมันได้มากเท่าไร เราก็มีโอกาสใช้ AI สร้างสิ่งที่มีคุณค่าได้มากขึ้นเท่านั้น เพราะฉะนั้นหนึ่งในสิ่งที่สำคัญที่สุดก็จะวนกลับมาที่

การเป็นตัวเองที่เก่งขึ้นทุกวัน อ่านเยอะๆ เรียนเยอะๆ เขียนเยอะๆ เพื่อเป็นตัวเองในเวอร์ชันที่ดีขึ้น

Mindset

สิ่งที่สำคัญคือ ให้เรียนรู้เสมอ > ไม่รู้อะไรก็ถาม AI > สร้างสิ่งที่มีคุณค่า > แชร์สิ่งนั้นให้กับผู้อื่น AI ควรจะทำให้เราเก่งขึ้นทุกวัน AI ควรจะช่วยเราสร้าง solution ให้กับปัญหาต่างๆ ในชีวิต

ทักษะสำคัญในยุคนี้คือ

Thinking กระบวนการคิด ที่ยังคงเป็นหน้าที่หลักของมนุษย์
English (is a new coding language) เนื่องจากปัจจุบัน AI สามารถช่วยเราเขียนโค้ดได้ ดังนั้นสิ่งที่สำคัญคือการ prompt ให้ AI ทำงานให้เรา ซึ่งควรจะ prompt เป็นภาษาอังกฤษมากกว่าเนื่องจากภาษาไทยจะเปลือง Tokens มากกว่ามาก
Reading อ่าน output ที่ AI ตอบมา, รวมถึงการอ่านหนังสือเพื่อพัฒนาตัวเองเป็นเวอร์ชันที่ดีขึ้นทุกวัน
Writing การเขียน prompt ให้ AI คือจุดวัดว่า AI จะให้ output ที่ดีกับเราได้แค่ไหน, รวมถึงการเขียนยังเป็นการคิดบนกระดาษที่ช่วยให้เราพัฒนาความคิดและพัฒนาตัวเองอีกด้วย

Prompt Framework (RICE)

เวลาจะ Prompt อะไรสักอย่างให้ AI ควรจะมีข้อมูลตาม Framework ด้านล่าง ซึ่งผลลัพธ์จะดีกว่าการ prompt คร่าวๆ แค่ประโยคเดียวหรือ prompt แบบไม่ลงดีเทล

Role ใส่ details ว่าจะให้ AI เป็นใคร อาชีพอะไร ตำแหน่งอะไร
Instruction (Task) งานที่จะให้ AI ทำ
Context มี data อะไรให้บ้าง, AI ต้องให้ data อะไรเรา, จะส่ง data นี้ให้ใคร
Format (Example) ว่าเราอยากได้ output ใน format ไหน, หากมีตัวอย่างก็ให้ AI ดู

Gemini Web

ขอยกตัวอย่างบางส่วนที่น่าสนใจจาก Gemini Web ค่ะ

Gems

Chatbot ที่สร้างขึ้นมาเพื่อ one specific task เช่น เป็น Data analyst, เป็น AI แนะนำหนังสือ, เป็นผู้เขียนหนังสือเล่มที่คุณชอบ โดยเราสามารถสร้าง New Gems ด้วยการใส่

Name
Description สั้นๆ ของ Gems
Instructions (RICE framework)
Default Tool ของ Gems
Knowledge อัปโหลดไฟล์ให้เป็น knowledge badge หรือ reference สำหรับ Gems ตัวนี้ได้

Pro Tip : เขียนสร้าง Gem ที่มีจุดประสงค์คือเอาไว้สร้าง Gem อื่นๆ ในอนาคตอีกทีนึง

Settings

Settings > Personal context : เราสามารถ add ข้อมูลว่าเราเป็นใคร, สิ่งที่ชอบ, เป้าหมายในชีวิต, สิ่งที่อยากเรียน, ปรัชญาหลักในชีวิต, หนังสือที่ชอบ เพื่อให้ Gemini จดจำแล้วให้ output กับเรา based on ข้อมูลที่เราให้ไว้ตรงนี้

Caution

Chat log หรือข้อมูลต่างๆ ที่เราให้ google สามารถเอา data ไปใช้เทรน AI เวอร์ชันหน้าได้ เว้นแต่เป็น Google workspace user ดังนั้นอย่าใส่ข้อมูลที่ sensitive หรือเป็น personal เกินไป

Gemini CLI

CLI ย่อมาจาก Command line interface คือการที่เราเขียน command เขียน prompt ใน terminal แล้วได้คำตอบใน terminal ของเครื่องเราเลย ไม่ต้องใช้ Gemini ผ่าน Web

ทำไมถึงต้องใช้ CLI

ข้อดีของ CLI คือ

เร็วกว่า
รันใน local file ได้ ซึ่งแปลว่า gemini สามารถสร้างไฟล์ สร้างโฟลเดอร์ในเครื่องเราตามคำสั่งที่ได้รับได้เลย ซึ่งต่างจาก Web ที่ถ้าจะให้ gemini access ไฟล์ต้อง save ไฟล์ผ่าน google drive
สามารถใช้ tools ในคอมพิวเตอร์ของเราได้ เช่น SQL, R, Python
ใช้ MPC (Model context protocol) ได้ ซึ่งจะทำให้ gemini สามารถทำงานกับ third parties website ได้ เช่น Notion, Wordpress, Canva เป็นต้น

วิธีติดตั้ง Gemini CLI

Install nodejs ในเครื่องก่อน Download Node.js
เปิด Terminal ของเครื่องเราขึ้นมาแล้วรันคำสั่ง npm install -g @google/gemini-cli
ถ้าหากใช้ mac แล้วรันไม่ได้ ให้ใช้คำสั่ง sudo npm install -g @google/gemini-cli (Note : sudo คือ superuser do ไว้ใช้สำหรับติดตั้งโปรแกรมที่เชื่อถือได้เท่านั้น) เท่านี้ก็เรียบร้อย

จากนั้นเลือกโฟลเดอร์ที่เราต้องการจะปลุก gemini มันขึ้นมา โดยดูว่าตอนนี้ใน Terminal เราอยู่ที่ไหนผ่าน command เหล่านี้

pwd = print working directory = ตอนนี้เราอยู่ที่ไหน
cd แล้วใส่ชื่อโฟลเดอร์ที่เราจะเข้าไป = change directory
mkdir = make directory (create new folder)
ls = list files in current folder

เมื่ออยู่ในโฟลเดอร์ที่ต้องการแล้ว ก็รันคำสั่ง gemini เพื่อเรียกใช้ gemini ได้เลยค่ะ

หลังจากนั้นเราก็สามารถ prompt ถาม gemini ได้ไม่ต่างจาก website รวมถึงให้มันทำงานบน local file ตามคำสั่งของเราได้ด้วย

ตัวอย่าง commands ที่ใช้ได้

/auth = log in gemini
/model = select gemini models
/clear = clean chat
/quit = exit
/memory = เขียนอะไรที่อยากให้ gemini จำ (เหมือน Personal context ใน Gemini Web)
/stats session = เช็กว่าใช้ไปกี่ token แล้ว
/tools list = tool ของ gemini โดยที่ gemini จะเรียกใช้เครื่องมือต่างๆ เองตาม query ของ user
/cat file = ดู content ในไฟล์นั้น

Skills

เปรียบเสมือน Gems ใน gemini cli ซึ่งเราสามารถเขียน prompt ด้วยภาษาอังกฤษปกติให้ gemini สร้าง new skill ให้ได้เลย

สามารถเช็ก skills ได้โดยใช้ command /skills list

Sub-Agents

เราสามารถเรียก Sub-Agents ให้มาช่วยงานเราได้ อย่างเช่น ตัว generalist ที่เหมาะสำหรับการทำงานเป็น batch task ทำงานหลายไฟล์พร้อมกัน, งาน repetitive task เช่น การ research ข้อมูลเกี่ยวกับ products 5 อย่างพร้อมกัน เรียกใช้ Sub-Agents ได้ดังนี้ @generalist แล้วต่อด้วย prompt ปกติ เช่น research...

MCP (Model context protocol)

คือการเพิ่มเครื่องมือให้ Agent ของเราเลือกใช้ได้มากขึ้น เปรียบเสมือน USB ของ AI ที่เชื่อมคอมพิวเตอร์ของเรากับ third parties app ทำให้ gemini cli ของเราทำงานบน third parties app ได้จาก terminal เลย

MCP clients (Gemini CLI) <--> MCP Server <--> Public API

โดยตัว API ที่เป็นโค้ดยากๆ นั้นยังเหมือนเดิม เพียงแต่ว่า MCP Server ที่เป็นตัวคั่นกลางที่ทาง third parties app จัดมาให้นั้นทำให้ Gemini CLI ไม่ต้องไปคุยกับ API ที่ซับซ้อน User แบบเราสามารถพิมพ์ prompt เป็นภาษาอังกฤษปกติคุยได้เลย

วิธีเชื่อมต่อ MCP

เลือก extensions ที่อยากเชื่อมต่อจาก Gemini CLI extensions แล้ว copy prompt ออกมา
รัน prompt นั้นใน Gemini CLI ใน Shell mode (กด ! ก่อนใส่ prompt) เท่านี้ก็เรียบร้อย

เช็ก mcp ได้จาก /mcp list

ยกตัวอย่างการเชื่อม MCP ของ Canva

หลังจากที่รัน prompt และ sign-in Canva account เรียบร้อยแล้วก็ลองใส่ prompt ง่ายๆ อย่างเช่น

create canva design with the size of 1920 x 1020 px, contain the word 'Sample' with the cream colour background and brown font, decorate with the star and galaxy theme

ผลลัพธ์ที่ได้คือ

gemini จะ create design ให้เราเลือก 4 options ซึ่งเราสามารถเลือกหรือสามารถ prompt แก้ไขเพิ่มเติมได้อีก หากเราเลือกเรียบร้อยมันก็จะไปขึ้นที่ใน Canva ของเราตามตัวอย่างในรูปด้านล่าง Screen Shot 2569-04-13 at 15.08.44

จากใจคนที่ไม่ใช่สาย tech ใช้ AI ไม่มากแบบเราคือ รู้สึกอึ้งเลยว่าเขียน prompt นิดเดียว gemini ก็สร้าง design ออกมาใน Canva ได้ทันที ซึ่งเราสามารถ edit ต่อใน Canva ได้อีกด้วย ทั้งนี้ gemini ที่เราใช้เป็นตัวฟรีนะคะ

The Future

AI จะไม่ใช่แค่ chatbot ถามตอบอีกต่อไป แต่ Agentic AI หรือ CLI นั้นสามารถทำงานให้เราได้ด้วย อนาคตมนุษย์จะทำงานน้อยลง แต่ได้คิดเยอะขึ้นว่าจะทำอะไรดี สร้างอะไรดี

หลังจากที่ได้เรียน Bootcamp สองวันนี้ที่ยังไม่นับคลาสเสริมอีก เราก็รู้ได้เลยว่าข้อจำกัดตอนนี้จริงๆ คือ ตัวเราเองนี่แหละ ว่าใช้ AI เป็นแค่ไหน มีไอเดียสร้างอะไรใหม่ๆ มากน้อยแค่ไหน มันจึงวกกลับไปที่การพัฒนาตัวเองให้สม่ำเสมอ อ่านเยอะๆ , เรียน เขียน และแชร์ เพื่อเป็นตัวเองในเวอร์ชันที่ดีขึ้นทุกวันค่ะ