哪个框架才是真正能“拯救”你的AI项目?核心要点CRISP-DM已过时。Agile本身不够用。TDSP虽然流程好但绑定厂商。CPMAI是新兴选手。MLOps必不可少但不是万能钥匙。欢迎来到你的AI项目生存秘籍。1.为什么你的AI项目注定失败(以及该怎么做)AI已经不再是研究机构的专属,它已成为现代企业战略的核心。但现实是:近一半的AI项目未能创造真正的价值。为什么?因为大多数团队还在用传统软件
2 天前/35 人阅读/1 人点赞
在研究自主代理及其背后的LLM(大型语言模型)时,我一直对文章和技术论文中频繁提及的基准测试充满好奇。虽然我很快就能理解模型开放性的重要性(我对此极为坚定),但我仍需要更清晰地了解这些基准测试实际测量的内容,以及如何正确解读它们的结果。我想,如果我都在努力搞懂这些基准测试,可能其他人也有同样的困惑。下面是我目前为止了解到的LLM基准测试生态,以及为什么最终:“开放性”可能比任何性能分数都更重要。为
2 天前/49 人阅读/0 人点赞
欢迎回来!今天我们来聊点新的。这是一个新鲜的概念,甚至带点未来感。我自己也在试验它。我称之为“LLM理事会(CouncilofLLMs)”。这个新颖的想法可能会从根本上改变我们在工作和测试中头脑风暴、制定策略、生成关键想法及其优化的方式。什么是“LLM理事会”?想象一个值得信赖的顾问团,总是随时待命、保持警觉。里面有各种各样的智慧,每个成员都能提供独特的见解,帮助你解决难题。但这个“理事会”不是由
2 天前/30 人阅读/0 人点赞
我最近正在通过MinistryofTesting推出的30天AI测试挑战(30DaysofAIinTestingChallenge)学习AI在测试领域的应用。这个备忘单就是我与另一位挑战参与者、出色的测试人员JoyzNg一起合作的成果。我们结合了对提示词工程(PromptEngineering)的学习、各种提示技巧以及我们自己使用AI大语言模型(LLMs)时的实际经验,共同总结出这份清单,帮助测试
2 天前/40 人阅读/0 人点赞
想象你雇佣了一位专家,却从不告诉他你需要什么。最好的结果是得到一些随机建议,最坏的情况则是一团糟。在AI的世界里,“系统提示词(SystemPrompt)”就像是这份“职位描述”——它是每条用户指令之上的元指令,定义AI的人格、范围、规则和风格,在AI“听”到用户之前就已设定好。用户提示词(UserPrompt):处理即时请求,如“翻译这段”、“讲个笑话”、“修复我的SQL”。系统提示词(Sy
2 天前/55 人阅读/0 人点赞
这是一个旨在帮助软件测试人员根据任务复杂度和输出质量需求选择合适大语言模型(LLM)的实用指南。文中提到的图表将测试任务按“推理深度”与“输出质量”两个维度划分为四个象限,每个象限中都列出了适用的AI模型图标以及对应的测试活动,例如生成测试数据、头脑风暴、编写自动化代码和设计全面测试策略等。🔍为什么要选对AI模型?市面上的AI模型五花八门:有的免费有的响应快有的则拥有深度洞察力,对测试人员至
2 天前/45 人阅读/0 人点赞
每个传奇都需要它的“大师之剑”——那把将潜力转化为力量的关键神器。在实现企业AI自主化的征途中,我们已经收集了各种组件,组建了工具箱,但一直缺失一样关键的东西。就像林克没有标志性圣剑就去面对盖侬,我们的代理式AI(AgenticAI)愿景也一直缺少一把真正能在大规模落地中大放异彩的武器:高效的分布式推理能力。在《AgentOps时代》中,我曾谈到未来的自主基础设施将像生物体一样运作——自我维持
2 天前/28 人阅读/0 人点赞
我还记得第一次看《非常嫌疑犯》的情景——这是那种只有第一次观看时才能真正享受的电影。凯文·史派西饰演的凯瑟·索泽(KeyserSöze)在整部影片中伪装成一个无害、跛脚的骗子VerbalKint,精心构建了一个不引人怀疑的伪装。直到最后那一刻,他走出警察局时跛脚慢慢消失,我们才恍然大悟:自己被彻底欺骗了。研究Claude的公司Anthropic去年末也经历了类似的“天呐”时刻——他们发现自己的
2 天前/24 人阅读/0 人点赞
在90年代末,我还在伯克利读书,眼睁睁看着互联网泡沫像一场发烧梦一般上演。流量就是收入;在公司名后加个“.com”,投资人就会撒钱;没有商业模式的创业公司都在投超级碗广告,许多人一夜之间成了“纸上百万富翁”。我1999年在SunMicrosystems实习时,常常开车沿101号公路经过那些贴满AltaVista、Excite等公司广告牌的办公楼——这些公司后来都注定要灭亡。2001年时,这些大
2 天前/38 人阅读/0 人点赞
最近在领英(LinkedIn)上获悉,工作流自动化专家Zapier也加入了MCP的行列,并决定通过MCP的方式提供其所有的集成功能。感谢Angie的及时提醒。这将使AI智能体能够与这些集成功能进行交互,也为像我这样的人(略懂技术但非专业开发者)带来了很多实验机会,让我们能够更多地了解这项不断发展的技术。AngieJones在领英上的帖子,是我第一次听说ZapierMCP服务器。以下是我进行
2025-06-14/240 人阅读/0 人点赞
大家好,我是陈哥。当下,国产化替代稳步推进,不少企事业单位对工作中所用的到信创产品提出了更高的要求。硬件、操作系统和数据库等产品的国产化替代受到了一定的重视,但底层框架的国产化同样不容忽视。正如华为创始人任正非所说:“核心技术是买不来的,只有自主创新才能立于不败之地。”这与禅道的观点不谋而合,我们一直在不断探索和优化软件的架构。在《国产化替代是个伪命题?被误解多年的开源软件,如今怎么样了?
58°
/584 人阅读/0 人点赞/0 条评论
《聊聊其他“Ops”(一)》中跟大家简单介绍了DevOps,以及与其概念相近的NoOps、DevSecOps和GitOps。“Ops家族”还包含其他形式,但归根结底,DevOps之所以更为流行,是因为其提供了改进工作流程的最全面的方法,因而被广泛应用。一、DevOpsvs.ITOps接下来,我们将更仔细地了解一下ITOps。许多开发人员将ITOps视为DevOps更传统的版本,但实际上它不止
110°
/1108 人阅读/0 人点赞/0 条评论
大家好,我是陈哥,今天想和大家聊聊敏捷团队项目的准时交付~敏捷方法和硬性期限看似是两个不相容的概念。提到“敏捷”,我们通常会想到灵活性、适应性、迭代和持续改进,而“期限”往往与固定日期、最终性和时间压力有关。实际上,敏捷与期限并非完全对立,它们之间可以找到一个合适的平衡点,使得项目既能保持灵活性,又能遵守时间节点。正如知名敏捷教练玛丽·波彭迪克(MaryPoppendieck)所说:准时交
160°
/1606 人阅读/0 人点赞/0 条评论
大家好,我是陈哥,今天想和大家聊聊Git合并冲突解决~背景前几天,我正好收到了一位读者的留言:又又又又遇到了Git合并冲突,解决冲突比写代码还费劲,突然想起SVN的好。该怎么避免Git冲突啊?我想,比如这样?在我看来,Git合并冲突是不可避免的。在本文,我想和大家简单分享一下遇到Git冲突该如何解决,希望对大家有所帮助。在此之前,我们先来了解一下Git的合并冲突是什么以及合并冲突的类型有哪
254°
/2540 人阅读/295 人点赞/0 条评论
大家好,我是陈哥,今天聊聊禅道的代码提交规范~背景在《还不知道这个原则的程序员,要小心了》的文章中,我提到了禅道的代码提交规范。简单来说,我们将工具融入到禅道团队的日常代码提交过程中,利用工具对流程、行为进行规范和约束。接下来,我将从编码规范、测试规范等方面,和大家简单分享一下禅道团队的代码提交规范。为了方便大家了解和学习,大家可以发送【代码提交规范】,免费领取禅道团队的代码提交规范。
289°
/2891 人阅读/293 人点赞/0 条评论
一位读者在看过我的《理解这八大优势,才算精通单元测试》后,问我:知道单元测试有好处,但实在没空写。看完文章后又想重新落实一下,有没有啥写好单元测试的技巧?这位读者绝对不是第一个和我抱怨单元测试的人。这很好理解,中国互联网公司太多太卷,想要抢夺市场就要推出不同功能,而这些压力一部分落在了程序员身上,拼命赶需求。单元测试这种费力不讨好的事情,自然而然就没有人做。就我多年的经验来看,写单元测试其实不
313°
/3136 人阅读/293 人点赞/0 条评论
在准备将软件上线到生产环境之前需要进行测试。随着软件测试方式日趋成熟,软件开发团队的测试也在取代大量手动测试,逐渐实现自动化测试。通过自动化测试,开发团队可以在短短几分钟内就了解到软件是否存在问题,而不需要等待几天的时间。自动化测试大大地缩短了反馈周期,与敏捷开发、持续集成和DevOps文化密切相关。本文将分为上、下篇来探讨如何构建一个高响应、可靠并且可维护的测试组合,无论是针对微服务架构、移动
439°
/4391 人阅读/292 人点赞/0 条评论
作为开发人员,我们应该遵守这样一句话:“质量不是来自检查,而是来自生产过程的改进。”——爱德华·戴明 “测试即代码。”太多的组织将任何未编码的东西视为一次性的。很明显,测试是必不可少的,但我们一次又一次地发现,团队将测试自动化和相关材料视为二等公民。测试是用户行为的文档,与产品组织产生的需求密不可分,并在虚拟层面与用于创建功能的代码相连。 如果它提供了价值,就应该对它进行版本化、维护、照顾和尊重,
463°
/4634 人阅读/189 人点赞/0 条评论
技术性债务在DevOps到底意味着什么?从本质上讲,这是小的开发缺陷的积累,需要不断地返工。它可能由多种原因引起,例如快速交付新功能的压力,这可能会导致团队不得不牺牲代码的整洁和完善。但这些不完整的小代码,如经济上的债务一样,随着时间的推移会产生“利息”,在软件工程里就表现为修改的挑战或添加新功能的困难。 一、技术债务的原因技术债务的主要原因之一是组织的开发方和业务方之间的脱节。开发团队经常会感到
401°
/4012 人阅读/270 人点赞/0 条评论
在《TDD、BDD、ATDD都是什么、有什么区别?(上)》一文中,探讨了探讨TDD、BDD和ATDD的概念。虽然TDD、BDD和ATDD都是软件开发中使用的测试方法,但它们在方法和重点上有所不同。TDD、BDD和ATDD之间的主要区别在于关注点、抽象层级和协作。1、关注点TDD侧重于测试代码并确保它满足需求。BDD关注软件的行为,并确保它满足业务需求。ATDD关注于验收标准,并确保软件满足业务
441°
/4411 人阅读/184 人点赞/0 条评论