2026世界杯官方指定中国区认证平台 AI写代码遵循低? 不是模子问题, 是你没给它配好“缰绳”!

2026世界杯官方指定中国区认证平台 AI写代码遵循低? 不是模子问题，是你没给它配好“缰绳”!

本年年头从公司去职之后，我驱动我方作念姿首。一个体育AI平台、一个黑胶唱片储藏小表率，都是从零驱动。莫得研发团队了，就我一个东说念主，遐想、确立、测试全包。

我不是表率员诞生。作念了三年AI居品司理，PRD写了一堆，代码的确我方出手写的很少。去职之后决定试试用AI援手确立，毕竟天天给别东说念主遐想AI居品，也该我方吃一下狗粮了。

刚驱动那段时间挺横祸的。大开Cursor，跟Claude说”帮我写一个唱片储藏页面”，它刷刷刷生成一大坨代码，看着像那么回事。一跑，页面出来了但数据没存进去。补一句”数据要存到数据库”，它又生成一版，此次数据存了但字段对不上。再补一句”字段用这个Schema”，它改了，但把之前写好的神态搞丢了。改来改去，一个下昼畴昔了，一个页面还没弄完。

体感上，我粗略有30%的代码是AI写的，剩下70%要么是我方写的，要么是AI写了之后我改得焕然一新的。跟那些”AI帮我一天作念了一个App”的说法差距太大了。我一度怀疑是不是我方太菜。

盘曲发生在三月底。我在社区里看到有东说念主聊一个见地：Harness Engineering。

这个词最早是Mitchell Hashimoto在2026年2月建议来的，然后OpenAI发了阿谁百万行代码实验陈述也用了这个词，一下子就火了。社区里有东说念主基于Claude Code的源码写了本书叫《专揽工程》，把这套理念拆得很细。Claude Code的官方说法是：Claude Code serves as the agentic harness around Claude——它提供用具、凹凸文管束和践诺环境，把一个言语模子酿成一个能干活的编码Agent。

harness这个词终点形象。套在马身上的那整套装备——缰绳、嚼子、胸带——就叫harness。不是让马跑得更快，是让马往你想让它去的场所跑，同期确保你不会摔下来。

我看了一晚上联系的东西，有点坐不住了。已而意志到我方之前的问题不是AI不够灵巧，是我从来没给AI搭过一套像样的harness。说白了等于：我一直在换马，没想过换缰绳。

然后我拿黑胶唱片小表率这个姿首作念了个实验。花了一周时间，用Harness Engineering的想路从头来过。

先说我之前的使命阵势。大开Claude Code或者Cursor，获胜跟它说”帮我作念储藏管束功能”。它驱动写，写完我看一眼，发现不合——它把唱片字段遐想成了五六个通用字段，但我的Schema有二十多个专科字段：厂牌、版次、母带编号、压片国度这些。AI不知说念这些，它只可猜。补一句改造，它改了这里又漏了那边。一来一趟，半小时畴昔了，生成了三四个版块，终末可能照旧得我我方上手改一半。

问题出在哪？AI根底不知说念它在干什么。它不知说念这个姿首是给黑胶唱片嗜好者作念的、不知说念字段结构长什么样、不知说念标签体系有立场/厂牌/年代/版块四个维度、不知说念前端用的什么框架。它每一轮只可看到你当下给它的那一小块凹凸文，畸形于蒙着眼在一个生疏的屋子里摸索。你说”往左走”，它走了，但它不知说念左边是墙照旧门。

Harness Engineering解决的等于这个问题：你毋庸每次都告诉AI该怎样作念，你把”该怎样作念”写进环境里，让它随时能我方查到。

我作念的第一件事是写CLAUDE.md。

这个文献是Claude Code的一个机制——放在姿首根目次下，AI每次启动都会自动读取。畸形于你给它一份”使命手册”。我在内部写了：这是一个微信小表率，给黑胶唱片嗜好者作念储藏管束的；技艺栈是什么；目次结构长什么样；唱片数据的完竣Schema（20多个字段每个是什么兴味）；标签体系怎样分层；四个中枢功能模块之间怎样联动；UI立场参考；以及最进攻的——哪些东西不成动，比如数据库的Schema结构一朝定了就不许AI自作东张改。

写这个文献花了我泰半天。很烦。这些东西普通都在我脑子里——调研了8个黑胶嗜好者得来的需求、竞品分析的论断、我我方算作储藏者的使用俗例——逼我方把它们全部结构化地写出来比瞎想中难。

但写完之后恶果立竿见影。AI驱动生成代码的时候，不再瞎猜了。它知说念这是微信小表率不是H5网页，知说念唱片有”首版””重版””限量版”的分袂，知说念标签筛选要复旧多维交叉，知说念破耗统计要按币种分。这些事情以前每次对话都得说一遍或者等它写错了再改造，咫尺它获胜就知说念了。

第二件事是拆任务的阵势变了。

以前我会获胜说”帮我作念储藏管束功能”，这是一个大任务。AI接到这种大任务，会试图不时解决，然后在中间某个地方翻车。Harness Engineering的作念法是：写spec。等于驱动干活之前先写一份粗浅的任务规格——想法是什么、领域是什么、验收轨范是什么、依赖什么、不成改什么。

我其后养成了一个俗例：每个稍稍复杂少量的功能，先花五分钟写一个spec。这五分钟十足不是糜费。因为spec写明晰了，AI一次收遵循极高；spec没写明晰，AI生成三四版还在原地打转。

有一次我偷懒没写spec，获胜让它作念标签筛选功能。它作念完之后我一看——把标签遐想成了扁平的单层结构，悉数标签混在一说念。但我的遐想是四维分层的：立场标签、厂牌标签、年代标签、版块标签，彼此悲怆，2026世界杯(中国)复雅故叉筛选。AI不知说念这个遐想意图，它按我方的领会作念了一个”够用”的有筹画。要是我在spec里写一句”标签四维分层，参考CLAUDE.md中标签体系界说”，这个返工根底不会发生。五分钟省两小时，这笔账太合算了。

第三件事是诳骗好用具链。

Claude Code不仅仅一个生成文本的模子，它有一堆用具——能读文献、写文献、搜代码、跑大叫。Harness Engineering里有个不雅点：Agent的智商取决于你给它配了什么用具，以及它在什么时候用什么用具。

我在CLAUDE.md里加了一条：”驱动任何改变之前，先读取现存联系文献证据现时情景。”就这一句话，AI的活动就变了。它不再上来就出手写新代码，而是先读一遍已有的代码望望近况，搞明晰凹凸文再出手。这个使命流任何有教育的确立者都知说念该这样作念，但要是你不告诉AI，它确实不会主动作念——它会获胜开写，然后跟已有代码打破。

还有一个很实用的限定：让AI每次改完代码我方作念一轮查验。我写了一条”完成修改后查验是否引入了硬编码值或TODO”。这是我之前的痛点——AI为了让代码跑通，常常会塞一个hardcoded的建树进去，比如获胜把我的测试用唱片数据写死在代码里。你不仔细看根底发现不了。

第四件事，亦然我合计影响最大的：分明晰哪些事让AI我方跑，哪些事我方盯。

Claude Code有一个遐想叫权限系统——哪些操作AI不错我方作念，哪些需要东说念主证据。Harness Engineering的理念是：不是悉数任务都需要同等进度的监督。写一个展示组件和遐想数据库Schema，风险完全不通常。

开云体育中国官网入口

我把使命分红了三档。低风险的——列表页面、确定页面、粗浅的UI组件——让AI获胜跑，我不一个个看。中等风险的——数据存取逻辑、标签筛选算法、统计打算——AI写完我review一遍。高风险的——Schema遐想、数据搬动、中枢交互逻辑——我我方主导，AI援手。

以前我的瓶颈不是AI写得慢，是我看得慢——AI每生成一段代码我都逐行对，因为不确定它会不会在某个不起眼的地方埋雷。分级之后，低风险的跳过，元气心灵皆集在高风险的部分。一天能推动的使命量翻了不啻一倍。

一周下来体感是这样的：前两天险些莫得代码产出，全在搭harness——写CLAUDE.md、定spec模板、配限定。第三天驱动干活，遵循坐窝就不通常了。到第五天也曾进入一种节律：我把功能拆成一个个明确的包，扔给AI，它去作念，我来验收。大部分一次过，偶尔要调遣，但很少需要推翻重来。

背面两天在作念一些边边角角的体验优化，我已而有一种挺奇妙的嗅觉——我好像不是在”写代码”了，是在”管束一个写代码的Agent”。我的使命从”终了”酿成了”遐想”和”验收”。对一个居品司理诞生的东说念主来说，这个情景其实反而更当然。

这个体验让我预料一件事。

我之前在公司作念企业AI居品的时候，花了许多时间想怎样让AI输出更好——调教导词、优化学问库、升级模子。但Harness Engineering给了我一个完全不同的视角：与其让模子更灵巧，不如让模子”知说念我方在干什么”。一个知说念姿首结构、知说念数据Schema、知说念任务领域的”庸俗”模子，比一个什么都不知说念的”强”模子有效得多。

这不等于我之前作念企业AI居品时一直在解决的并吞个问题嘛？只不外换了个场景。

在AI Coding里，harness是CLAUDE.md、spec和用具链限定。在企业AI居品里，harness是限度学问库、使命流引擎和东说念主机联结界面。作念条约审核居品的时候，我给AI搭的那套——分章节生成、溯源标注、东说念主工复核节点——骨子上等于一套产等级的harness。那时不知说念这个词，但干的事是通常的。

是以我咫尺越来越合计，Harness Engineering不仅仅一个确立者的话题。它对居品司理也有施行兴味。

你遐想任何一个AI居品，都要修起几个问题：AI知不知说念用户的业务凹凸文？AI知不知说念什么叫”作念对了”？AI有莫得技巧考据我方的输出？哪些体式AI不错自主决策、哪些必须东说念主来证据？这些问题的谜底加起来，等于你这个居品的harness。

咫尺我作念新姿首的第一件事，不是大开剪辑器驱动写代码，是先花半天把CLAUDE.md写好。这个文献写得越明晰，背面AI的”自主率”就越高。前两天看起来没在”干活”的准备使命，恰正是通盘姿首里杠杆率最高的参预。

诚然了，90%这个数字有点讨巧。UI组件、列表页面这种可能95%以上是AI写的，中枢的筛选逻辑和数据结构遐想可能只好50%。平均下来是个大要的嗅觉，不是精准统计。况兼我这个姿首功能相比明确——之前作念了完竣的用户调研和居品遐想，AI只需要”终了”不需要”想”，这会让AI Coding率偏高一些。

但不论怎样说，从30%到90%，中间的差距不是模子升级带来的——用的是并吞个Claude。差距全在harness上。

要是你咫尺也在用AI写代码但嗅觉遵循卡在一个瓶颈上，先别急着换模子或者学更高档的教导词技巧。先望望你的harness——你的CLAUDE.md写了莫得？任务拆分澄澈吗？你有莫得在让AI”蒙着眼睛干活”？

我之前作念居品司理的时候，给新东说念主培训始终会说一句话：需求文档写不明晰2026世界杯官方指定中国区认证平台，研发写出来的东西一定不是你想要的。咫尺用AI写代码，兴味兴味完全通常。CLAUDE.md写不明晰，AI写出来的代码一定不是你想要的。区别仅仅以前边对的是一个会反问你的研发，咫尺边对的是一个不会反问你但会我方瞎猜的Agent。是以harness反而更进攻了。

世界杯最新消息

2026世界杯官方指定中国区认证平台 AI写代码遵循低? 不是模子问题, 是你没给它配好“缰绳”!

扫码关注