Harness គឺជាផលិតផល៖ ហេតុអ្វី ៩៨,៤% នៃ AI agent មិនមែនជា Model

មានលេខមួយដែលគួរតែផ្លាស់ប្ដូររបៀបដែលអ្នកគិតអំពីការសាងសង់ជាមួយ AI ហើយស្ទើរតែគ្មាននរណាម្នាក់នៅខាងក្រៅក្រុមអ្នកសរសេរកូដ agent បានយល់ច្បាស់ពីវានៅឡើយទេ។

នៅពេលអ្នកស្រាវជ្រាវនៅ MBZUAI បានឆ្លងកាត់ source code របស់ Claude Code — ប្រហែល ១,៨៨៤ ឯកសារ និងកូដកន្លះលានបន្ទាត់ — ហើយតម្រៀបអ្វីដែលពួកគេបានរកឃើញ ការបែងចែកនោះគួរឱ្យភ្ញាក់ផ្អើល។ ប្រហែល ១,៦% នៃ coding agent ផលិតកម្ម គឺជា AI decision logic។ គឺ model, prompts, ផ្នែកដែល “គិត”។ ឯ ៩៨,៤% ដែលនៅសល់ គឺជា harness៖ កូដដែលផ្ដល់ context ដល់ model ដំណើរការឧបករណ៍របស់វា ផ្ទៀងផ្ទាត់ outputs ព្យាយាមឡើងវិញនៅពេលបរាជ័យ គ្រប់គ្រងការចងចាំ និងសម្រេចថាពេលណាការងារបានបញ្ចប់។ ក្រុមបួនផ្សេងគ្នាបានសាងសង់ agent បួនផ្សេងគ្នា ហើយពួកគេទាំងអស់បានប្រសព្វគ្នាទៅរករូបរាងដូចគ្នាប្រហែលៗ។

ពិចារណាលើសមាមាត្រនោះមួយភ្លែត។ អ្វីដែលមនុស្សគ្រប់គ្នានិយាយអំពី — គឺ model — គឺជាចំណិតស្ដើង។ អ្វីដែលស្ទើរតែគ្មាននរណាម្នាក់និយាយអំពី — គឺ harness — គឺស្ទើរតែជាផលិតផលទាំងមូល។ សម្រាប់ក្រុមហ៊ុនមួយដែលដាក់ឈ្មោះតាម loop ដែល harness ដំណើរការ នេះមិនមែនជារឿងភ្ញាក់ផ្អើលទេ។ ប៉ុន្តែវាជាភស្តុតាងច្បាស់បំផុតរហូតមកដល់ពេលនេះសម្រាប់អ្វីមួយដែលយើងបានអះអាងពេញមួយឆ្នាំ៖ model គឺជាទំនិញ ឯ harness គឺជាសិល្បៈ។

តើ harness ពិតជាអ្វី

ពាក្យ “harness” បានក្លាយជាពាក្យមួយក្នុងចំណោមពាក្យដែលត្រូវបានប្រើដោយរលុង ដូច្នេះតោះកំណត់វាឱ្យច្បាស់។ Harness គឺជាអ្វីៗគ្រប់យ៉ាងដែលរុំ ជុំវិញ model ដែលប្រែ engine បំពេញ-អត្ថបទ ឱ្យក្លាយជាអ្វីមួយដែលអាចធ្វើការងារពិតប្រាកដបាន ដោយគ្មានមនុស្សវាយរាល់ជំហាន។

ជាក់ស្ដែង harness គ្រប់គ្រង៖

ការផ្គុំ context — សម្រេចថា model មើលឃើញអ្វីខ្លះនៅរាល់វេន៖ ភារកិច្ច ឯកសារពាក់ព័ន្ធ លទ្ធផលមុនៗ និងនិយមន័យឧបករណ៍។ ធ្វើផ្នែកនេះខុស នោះ model ឆ្លាតបំផុតក្នុងពិភពលោកនឹងផ្ដល់ឱ្យអ្នកនូវរឿងឥតន័យដ៏ប្រាកដប្រជា។
ការដំណើរការឧបករណ៍ — ការពិតប្រាកដនៃការដំណើរការ shell command កែឯកសារ ហៅ API ហើយប្រគល់លទ្ធផលត្រឡប់មកវិញ។ Typed tool schemas នៅទីនេះ ដូចដែលអក្សរសិល្ប៍ស្ថាបត្យកម្ម agent កត់សម្គាល់ កាត់បន្ថយយ៉ាងខ្លាំងនូវការហៅឧបករណ៍ខុសទម្រង់។
The loop — reason → act → observe ម្ដងហើយម្ដងទៀត រហូតដល់គោលដៅត្រូវបានសម្រេច។ នេះជាកន្លែងដែល loop engineering រស់នៅ។
ការផ្ទៀងផ្ទាត់ និងការឈប់ — ផ្នែកដ៏ពិបាកពិតប្រាកដ។ តើប្រព័ន្ធដឹងយ៉ាងណាថាការងារត្រឹមត្រូវ ហើយពេលណាដែលវាត្រូវបានអនុញ្ញាតឱ្យឈប់? test មួយជោគជ័យ CI ប្រែជាបៃតង reviewer model មួយយល់ព្រម។
Guardrails — sandboxing ដើម្បីកុំឱ្យ agent ដែលរត់ហួសហេតុបំផ្លាញ filesystem, code-review gates មុនពេលការផ្លាស់ប្ដូរចូលជាធរមាន ការបំបែក model ដែល សរសេរ ចេញពី model ដែល ពិនិត្យ។
ការចងចាំ និងការស្ដារ — អ្វីដែលនៅគង់វង្សរវាងវេន និងវគ្គ និងរបៀបដែលប្រព័ន្ធងើបឡើងវិញបន្ទាប់ពី crash ឬសំណើដែលត្រូវបានលុបចោល។

គ្មានផ្នែកណាមួយក្នុងចំណោមនោះជា model ទេ។ វាទាំងអស់ជាភាពខុសគ្នារវាង demo មួយ និងផលិតផលមួយ។

ហេតុអ្វី model តែងតែតូចជាងមុន (ជាសមាមាត្រ)

នេះជាផ្នែកដែលផ្ទុយនឹងវិចារណញ្ញាណ៖ ខណៈ model កាន់តែ ប្រសើរ harness កាន់តែ សំខាន់ ជាសមាមាត្រនៃការងារ មិនមែនតិចទេ។

Model ដែលមានសមត្ថភាពខ្ពស់ស្រូបយក scaffolding មួយចំនួន — ខ្សែ prompt ដ៏ប្រុងប្រយ័ត្នកាលពីឆ្នាំមុនដើម្បីបង្ខំការរៀបផែនការម្ដងមួយជំហានៗ គឺជាឥរិយាបថ native នៅឆ្នាំនេះ ដែលជាព្រំដែនមួយដែលយើងបានសរសេរនៅក្នុង Models ធៀបនឹង Agents។ ប៉ុន្តែ model ដែលមានសមត្ថភាពខ្ពស់ក៏ត្រូវបានទុកចិត្តឱ្យទទួលយកភារកិច្ច វែងជាង ប្រថុយជាង ស្វយ័តជាង។ ហើយភារកិច្ចកាន់តែវែង និងស្វយ័ត វាកាន់តែត្រូវការអ្វីដែល harness ផ្ដល់៖ context ដែលអាចទុកចិត្តបានឆ្លងកាត់វេនជាច្រើន ការផ្ទៀងផ្ទាត់ដែលអ្នកអាចទុកចិត្តដោយមិនចាំបាច់ឃ្លាំមើល guardrails សម្រាប់ពេលដែលវាមានបញ្ហា ការស្ដារនៅពេលវា crash នៅម៉ោងទីបី។

Andrej Karpathy បានចាប់យកទិសដៅនេះ នៅពេលគាត់ពណ៌នាអំពី “Loopy Era” — មនុស្សលែងសរសេរកូដភាគច្រើនទៀតហើយ ប៉ុន្តែដឹកនាំ ត្រួតពិនិត្យ និងរៀបចំក្រុម agent។ ការពិសោធ AutoResearch របស់គាត់ផ្ទាល់បានដំណើរការការពិសោធ ៧០០ ក្នុងរយៈពេលពីរថ្ងៃលើ GPU តែមួយ។ អ្នកមិនដំណើរការការពិសោធ ៧០០ ដោយគ្មានការឃ្លាំមើលដោយផ្អែកលើ prompt ល្អមួយទេ។ អ្នកដំណើរការវាដោយផ្អែកលើ harness ល្អមួយ។

នោះហើយជាមូលហេតុដែលសមាមាត្រ harness នៅគង់វង្ស — ឬកើនឡើង។ Model គឺជា engine ឯ harness គឺជាផ្នែកដែលនៅសល់ទាំងអស់នៃឡាន ផ្លូវ និងប្រព័ន្ធចរាចរណ៍។ Engine ប្រសើរជាងមិនធ្វើឱ្យឡានមានសារៈសំខាន់តិចទេ។

Harness ក៏ជារបាំងការពារ (moat) ដែរ

ការក្រឡេកមើលឡើងវិញនេះមានកម្លាំងសម្រាប់នរណាម្នាក់ដែលកំពុងសម្រេចថាត្រូវវិនិយោគនៅឯណា។

បើ model ជា ១,៦% នៃផលិតផល ហើយអ្នកមិនបង្វឹក frontier models ទេ នោះការប្រកួតប្រជែងលើ “យើងមានសិទ្ធិចូលប្រើ model ល្អ” គឺជាការប្រកួតប្រជែងលើទំនិញ។ មនុស្សគ្រប់គ្នាមានសិទ្ធិចូលប្រើ model ល្អ។ ការងារដែលអាចការពារបាន — ផ្នែកដែលពិបាកចម្លង ដែលប្រមូលផ្ដុំ ដែលអ្នកពិតជាអាចលក់បាន — គឺជា ៩៨,៤%៖ harness ដែលលៃតម្រូវសម្រាប់ domain ជាក់លាក់ codebase ជាក់លាក់ បរិយាកាសបទប្បញ្ញត្តិជាក់លាក់ ភាសាជាក់លាក់។

ទីផ្សារ guardrails តែម្នាក់ឯងត្រូវបានគេព្យាករថានឹងលើស ១០០ ពាន់លានដុល្លារត្រឹមឆ្នាំ ២០៣៤ ហើយ ៦៤% នៃអង្គភាពឥឡូវនេះរក្សាគោលនយោបាយសុវត្ថិភាព AI។ ការចំណាយនោះមិនបានទៅក្នុង models ទេ។ វាកំពុងទៅក្នុងស្រទាប់ harness — ការផ្ទៀងផ្ទាត់ sandboxing review gates observability — ព្រោះនោះជាកន្លែងដែលហានិភ័យផលិតកម្មពិតជាស្ថិតនៅ។ នៅពេលឧស្សាហកម្មធ្វើស្តង់ដារ interface របស់ model (ហើយជាមួយ Agentic AI Foundation ឥឡូវនេះកំពុងថែរក្សា ស្តង់ដារបើកចំហដូចជា MCP និង AGENTS.md វាកំពុងធ្វើ) ភាពខុសគ្នាផ្លាស់ឡើងលើ stack ចូលទៅក្នុង harness។ ព្រី្ដស្តង់ដារ ម៉ាស៊ីនកំណត់ឯង។

ហេតុអ្វីនេះជាដំណឹងល្អសម្រាប់អាស៊ីអាគ្នេយ៍

បើតម្លៃស្ថិតនៅក្នុង model នោះនេះនឹងជាល្បែងបិទ។ ការ pre-training frontier ចំណាយរាប់រយលានដុល្លារ ហើយ labs មួយក្ដាប់តូចគ្រប់គ្រងវា។ អ្នកអភិវឌ្ឍម្នាក់នៅភ្នំពេញ ឬ Da Nang ឬ Cebu នឹងស្ថិតនៅខាងក្រៅជារៀងរហូត ដោយជួលសិទ្ធិចូលប្រើ។

ប៉ុន្តែតម្លៃភាគច្រើនលើសលប់ស្ថិតនៅក្នុង harness — ហើយ harness គឺជា វិស្វកម្មសូហ្វវែរ។ វាជាការគ្រប់គ្រង context ការរួមបញ្ចូលឧបករណ៍ ការរចនា test ការដោះស្រាយកំហុស ចំណេះដឹង domain ការគិតជាប្រព័ន្ធដោយប្រុងប្រយ័ត្ន។ គ្មានផ្នែកណាមួយក្នុងចំណោមនោះត្រូវការ GPU cluster ទេ។ វាត្រូវការវិស្វករល្អដែលយល់ពីបញ្ហាមួយយ៉ាងស៊ីជម្រៅ ហើយអាស៊ីអាគ្នេយ៍មានពួកគេយ៉ាងបរិបូរណ៍ និងកំពុងរីកលូតលាស់យ៉ាងលឿន៖ កម្ពុជាតែម្នាក់ឯងឥឡូវនេះរាប់បាន startup AI ជាច្រើនដប់ និងបំពង់បង្ហូរទេពកោសល្យវ័យក្មេងដែលកំពុងពង្រីកចេញពីស្ថាប័នដូចជា RUPP និង ITC។

Harness ក៏ជាកន្លែងដែលចំណេះដឹង ក្នុងស្រុក ក្លាយជាគុណសម្បត្តិដែលគង់វង្សដែរ។ Agent ទូទៅមិនស្គាល់ទម្រង់ឯកសារខ្មែរ ឬភាពចម្លែកនៃលំហូរការអនុលោមភាពរបស់ធនាគារកម្ពុជា ឬរបៀបដែលសហករណ៍កសិកម្មពិតជាកត់ត្រាការប្រមូលផល។ Model គឺដូចគ្នានៅគ្រប់ទីកន្លែង ឯ harness គឺជាកន្លែងដែលអ្នកដាក់បញ្ចូល context ដែលធ្វើឱ្យវាមានប្រយោជន៍ នៅទីនេះ។ នោះមិនមែនជាគុណវិបត្តិដែលត្រូវយកឈ្នះទេ — វាជាទីតាំងដែលអាចការពារបាន ដែល frontier labs មិនអាចសាងសង់ពី California បានឡើយ។

អ្វីដែលត្រូវធ្វើជាមួយរឿងនេះ

បើអ្នកជាអ្នកអភិវឌ្ឍ៖ ឈប់បង្កើនប្រសិទ្ធភាព prompts ហើយចាប់ផ្ដើមធ្វើវិស្វកម្ម harness។ ឥទ្ធិពលលើកមិនមែននៅក្នុងពាក្យសម្ដីដ៏ឆ្លាតវៃជាងទេ — វានៅក្នុងការផ្គុំ context ល្អជាង loop ផ្ទៀងផ្ទាត់តឹងជាង guardrails ដែលអ្នកអាចទុកចិត្តដោយគ្មានការឃ្លាំមើល។ នោះជាជំនាញដែលប្រមូលផ្ដុំ និងជាជំនាញដែលទីផ្សារទើបតែនឹងបង់ប្រាក់ឱ្យ។

បើអ្នកជាអាជីវកម្ម៖ កុំទិញ “AI model មួយ”។ ទិញ — ឬសាងសង់ — harness ជុំវិញវាដែលត្រូវបានធ្វើរូបរាងសម្រាប់ការងារ របស់អ្នក។ Demo ដែលមានស្រាប់គឺជា ១,៦%។ អ្វីដែលពិតជាផ្លាស់ប្ដូរលេខរបស់អ្នកគឺ ៩៨,៤% ដែលគ្មាននរណាម្នាក់ដាក់លើ slide។

ហើយបើអ្នកនៅកន្លែងណាមួយក្នុងអាស៊ីអាគ្នេយ៍ ឆ្ងល់ថាតើមានកៅអីពិតប្រាកដនៅតុនេះឬអត់៖ មាន ហើយវាជាកៅអីធំជាង។ ផ្នែកថ្លៃ និងជាទំនិញនៃបញ្ញា កំពុងត្រូវបានផ្ដល់ឱ្យដោយឥតគិតថ្លៃជា API។ ផ្នែកដ៏មានតម្លៃ អាចការពារបាន សាងសង់-ដោយ-ខ្លួនឯង គឺជា harness — ហើយនោះជាវិស្វកម្ម គឺជារឿងដែលតំបន់នេះធ្វើ និងអាចធ្វើបាន ល្អដូចកន្លែងណាមួយនៅលើផែនដី។

Model គឺជាផ្កាភ្លើង។ Harness គឺជា engine។ សាងសង់ engine នោះ។