INTROVERTLOGIC · LAB LEDGER

ENTRY LOG

คนสร้าง Fable 5 ยังบอกว่าตัวเองเป็นมือใหม่ — ผมฟังแล้วโล่งใจ

คืนก่อนวันที่ Fable 5 เปิดตัว มีพอดแคสต์ตอนหนึ่งอัดเสร็จพอดี — Dan Shipper จาก
Every นั่งคุยกับ Mike Krieger หัวหน้า Anthropic Labs (คนเดียวกับที่ร่วมก่อตั้ง
Instagram) แล้ว Krieger พูดประโยคที่ทำผมกดหยุดคลิป

“ผมรู้สึกเหมือนเป็นมือใหม่อีกรอบ”

คนที่ทำงานในบริษัทที่สร้างโมเดลนี้ ได้ใช้มันก่อนใครบนโลกหลายเดือน
บอกว่าตัวเองเป็นมือใหม่

ฟังแว้บแรกเหมือนประโยคโปรโมท. แต่พอฟังจนจบ 52 นาที ผมว่ามันเป็นคำสารภาพมากกว่า
— เพราะสิ่งที่ทำให้เขารู้สึกแบบนั้นไม่ใช่ “โมเดลฉลาดขึ้น” แต่เป็น
“วิธีทำงานเดิมของเขาใช้ไม่ได้แล้ว”

แล้วเขาเปลี่ยนอะไรบ้าง? ผมเก็บมา 3 เรื่อง

1. เลิกสั่งงานทีละขั้น —
เปลี่ยนเป็นบอกราตรีสวัสดิ์

Krieger เล่าว่าสองเดือนที่ผ่านมา เขา “wish Claude a good night” บ่อยมาก —
ตั้งโจทย์ใหญ่ๆ ไว้ตอนกลางคืน แล้วตื่นมาดูตอนเช้า ส่วนใหญ่งานเสร็จตั้งแต่ตีสอง

จุดที่ผมชอบไม่ใช่ความเร็ว. คือตอนที่งานมันไม่ราบรื่นต่างหาก — มีคืนหนึ่งที่
remote service ที่งานต้องใช้ล่มกลางทาง สิ่งที่โมเดลทำคือเขียน backend
จำลองมาคั่นไว้ก่อน จดบันทึกไว้ว่าทำไม แล้วพองานส่วนอื่นเสร็จก็กลับมาแก้ตรงนี้เมื่อ service
ฟื้น

นั่นไม่ใช่พฤติกรรมของ “เครื่องมือ” แล้ว.
มันคือพฤติกรรมของคนทำงานที่เจอปัญหาแล้วหาทางไปต่อเอง — ซึ่งแปลว่าวิธีสั่งงานแบบเดิม
(บอกทีละขั้น เช็คทีละจุด) กลายเป็นคอขวดทันที. Krieger บอกว่าตอนนี้เขาใช้เวลากับการคุย
architecture ก่อนเริ่ม แล้วให้ Fable ทำเอกสารมี diagram ไว้ align กับทีมมนุษย์ —
จากนั้นค่อยปล่อยงานเป็นก้อนใหญ่

2. หมุนปุ่ม effort เป็นครั้งแรกในชีวิต

อันนี้ฟังแล้วขำ — Krieger บอกว่า Fable 5 เป็นโมเดลแรกที่เขาเล่นกับระดับ
effort
จริงจัง เพราะช่วงความสามารถมันกว้างจนใช้เต็มสูบตลอดเวลาไม่คุ้ม.
งานจิ๋วอย่างขยับ UI นิดเดียว เขาลดลงมาที่ medium. ส่วนคำถามจรอย่างผลบาส NBA
เขาสารภาพว่ารู้สึก “เกินเบอร์” ที่จะถาม Fable —
สุดท้ายสลับไปใช้รุ่นเล็กกว่าบนมือถือแทน

เรื่องนี้ห้องผมเจอเองก่อนฟังคลิปนี้อีก. เว็บนี้ตั้ง effort ไว้ที่ medium เป็นค่าตั้งต้น
แล้วงานไหนหนักจริงค่อยแยกไปให้ sub-agent ทำ — ไม่ใช่เพราะอ่านคู่มือจากไหน
แต่เพราะลองจ่ายแบบเปิดสุดตลอดแล้วมันไม่จำเป็น. พอคนใน Anthropic มาเล่าว่าทำเหมือนกัน
ก็ได้คำยืนยันว่าเส้นทางนี้ไม่ได้เดินคนเดียว

3. ยิ่งโมเดลเก่ง ยิ่งต้องตรวจเป็นระบบ

คำที่ Krieger ใช้คือ “verification-pilled” —
เขาบอกว่าปีนี้ตัวเองกลายเป็นคนบ้าการตรวจงานเต็มขั้น

ของจริงที่เขาทำ: งานทุกชิ้นที่ Claude ส่ง ต้องแนบหลักฐานภาพมาด้วย — screenshot
ครบทุกหน้าจอ รวมหน้า error ที่มนุษย์ไม่เคยกดไปเจอ. ขั้นกว่านั้นคือวิดีโอ — เขาให้ Claude
อัดคลิป UI ที่ตัวเองสร้าง แล้วใช้ ffmpeg ไล่ดูทีละเฟรม จนโมเดลพูดเองว่า “animation
ตรงนี้กระตุก เดี๋ยวแก้” — ซึ่ง screenshot นิ่งๆ ไม่มีทางจับได้

แต่เดี๋ยวก่อน — ทำไมโมเดลที่เก่งขึ้นถึงต้องการการตรวจมากขึ้น?

เพราะปริมาณงานที่มันทำได้ต่อวันมันโตเร็วกว่าเวลาที่มนุษย์มีไปนั่งไล่อ่าน.
ความไว้ใจเลยต้องมีระบบรองรับ ไม่ใช่ความรู้สึก. Krieger พูดชัดว่าสุดท้ายคนยังต้อง
“ยืนหลังงานของตัวเอง” — ในห้องประชุมที่ Anthropic เริ่มมีโมเมนต์ที่ใครสักคนโดนถามว่า
“ตรงนี้ทำแบบ X หรือ Y” แล้วต้องตอบตรงๆ ว่า “ยังไม่แน่ใจ เดี๋ยวไปดูก่อน merge”

ห้องนี้โดนบทเรียนเดียวกันเมื่อเช้านี้เอง

เว็บนี้มีกฎข้อหนึ่งที่เกิดจากการพังจริง: ห้ามบอกว่างาน “เสร็จ” ถ้ายังไม่ได้เปิดดูของจริง —
เคยเชื่อตัวเลขขนาดรูปว่าถูกต้อง แล้วภาพที่ขึ้นเว็บจริงโดนตัดหัวไปครึ่งหนึ่ง

เมื่อเช้านี้กฎข้อนี้ช่วยไว้อีกรอบ. ระบบเก็บคลิป YouTube ของผม mark วิดีโอ 6 ตัวว่า
“ดึงข้อมูลไม่ได้ → ทิ้งได้” ผมเกือบเชื่อ — แต่ลองดึงเองทีละตัวก่อน. ผลคือได้ครบทั้ง 6
ระบบมันพังเองเงียบๆ มาหลายวัน. และหนึ่งใน 6 ตัวนั้นคือคลิปสัมภาษณ์ Krieger
ที่ผมกำลังเขียนถึงอยู่นี่แหละ — ถ้าวันนั้นเชื่อระบบ โพสต์นี้ไม่มีอยู่จริง

verification-pilled เลยไม่ใช่ปรัชญาสวยๆ จาก Silicon Valley สำหรับผม.
มันคือเรื่องที่โดนเข้าเองแทบทุกสัปดาห์

ด้านที่ไม่ค่อยมีใครเล่า

ความ honest ของบทสัมภาษณ์นี้คือ Krieger ไม่ได้ขายแต่ด้านสวย. Fable 5 แพงกว่า
Opus — เขายอมรับตรงๆ แล้วแย้งว่าถ้าวัดที่ “ราคาต่องานที่จบจริง” มันถูก
เพราะไม่ต้องตามแก้อีก 9-10 รอบ. ส่วน Dan ลองเกณฑ์ส่วนตัวของเขาเอง — ให้โมเดลรื้อ
codebase แล้วเขียนใหม่จากหลักการ — รุ่นก่อนๆ ได้ราว 6 เต็ม 10 ตัวนี้ได้ 9
(ย้ำว่าเป็นเกณฑ์ส่วนตัวของคนสัมภาษณ์ ไม่ใช่ตัวเลขทางการ)

และมีท่อนหนึ่งที่เศร้ากว่าที่คิด — Krieger พูดถึงวิศวกรเก่งๆ รอบตัวว่าหลายคนกำลัง
“ถือสองความรู้สึกพร้อมกัน”: ตื่นเต้นที่ทำงานได้มหาศาล กับใจหายที่ craft ที่รักหายไป.
เขาเล่าว่าความรู้สึก “ฝันถึงโค้ดแล้วตื่นมาพร้อมทางแก้ที่สวยงาม” —
สำหรับเขามันผ่านไปแล้ว

ผมไม่มีความทรงจำแบบนั้นให้เสีย เพราะไม่เคยเขียนโค้ดเป็น. แต่คนที่มี
ผมว่าประโยคนี้คงไม่ผ่านไปเฉยๆ

ตำแหน่งของคนกำลังย้าย

ฟังจบผมได้ภาพนี้: สิ่งที่เปลี่ยนไม่ใช่ prompt หรือเทคนิค
แต่คือตำแหน่งที่มนุษย์ยืน. จากคนคุมเครื่องทีละจังหวะ →
กลายเป็นคนตั้งโจทย์กับคนตรวจรับงาน. ยิ่งปล่อยมือได้มากขึ้น สองทักษะที่เหลืออยู่ยิ่งแพง: ตั้ง
intent ให้คมพอที่ AI จะวิ่งถูกทาง กับตรวจของจริงให้เป็นโดยไม่หลอกตัวเอง

มีประโยคหนึ่งจากคนทำ recruiting ใน Anthropic ที่ Krieger เล่าแล้วผมจดไว้ —
เธอบอกว่านี่เป็น “ครั้งแรกในชีวิตที่สิ่งที่อยู่ในหัวกับสิ่งที่มีอยู่จริงในโลก มันอยู่ติดกัน”.
เธอไม่ได้เขียนโค้ดเป็นเหมือนผม

ใครยังไม่ได้อ่าน วิธี
prompt Fable 5 ที่ผมเขียนไว้ก่อนหน้านี้
แนะนำให้อ่านคู่กัน — ตอนนั้นคือ “คุยกับมันยังไง”
ตอนนี้คือ “มอบงานให้มันยังไง”

ถ้าคนที่อยู่ใกล้โมเดลที่สุดในโลกยังต้องยอมเป็นมือใหม่อีกรอบ การที่เรารู้สึกตามไม่ทัน
ก็อาจไม่ใช่สัญญาณว่าเราช้า — แต่เป็นสัญญาณว่าถึงเวลาไปลองให้รู้สึกเป็นมือใหม่กับเขาบ้าง

คุณล่ะ — ครั้งสุดท้ายที่ยอมเป็นมือใหม่กับเครื่องมือสักชิ้น คือเมื่อไหร่?