AI Pulse
📚 461 篇文章
📡 1779 条信号
🏷️ 248 个主题
📰 今日焦点

AI编程助手让思科工程师效率飙升:几周工作缩短到几小时

思科把 Codex 直接接到了生产工作流里。工程团队用它写了 AI Defense 产品的大部分代码,以及几乎所有新功能。Codex 能理解大型互连仓库的依赖关系,通过 CLI 自主跑“编译—测试—修复”的循环,并且在思科现有的代码审查、安全控制和治理框架内运行。

效果是具体的。Codex 分析超过 15 个互连仓库的构建日志和依赖图,把构建时间压低了约 20%,每月在全球工程环境中节省超过 1500 小时。使用 Codex-CLI,大规模 C/C++ 代码库的缺陷修复吞吐量提升了 10–15 倍——原来几周的手工工作,现在几小时完成。

思科还是 OpenAI Daybreak 计划的主要安全组织之一。该计划把 OpenAI 模型、Codex 和安全合作伙伴绑在一起,加速网络防御。作为计划的一部分,思科管理了对 GPT‑5.5‑Cyber(一个面向网络防御者的模型)的访问。

阅读全文 →
✨ AI 智能助理 基于全站 619 篇深度内容综合问答
💡 试试问我: ·

🔥 信号雷达

来自 𝕏 的实时信号,经 AI 聚类分析

苹果M芯片跑大模型,首token延迟压到0.08秒

AITOOLEXPERIENCE
1.8万28148188

用苹果电脑跑本地大模型的兄弟注意了! 有个东西你们可能还没用上 —— Rapid-MLX 专门为 Apple Silicon(M系列芯片)打造的本地LLM推理服务, 核心就一句话: 比 Ollama 明显快很多,官方实测2-4倍加速!

用的是苹果官方MLX框架,吃透了M芯片架构。 主要狠在:
1、多轮对话首token延迟压到0.08秒左右,几乎感觉不到等待
2、工具调用做了17种智能解析器,Qwen、DeepSeek、Gemma等模型自动适配,量化坏了也能自动修复
3、原生OpenAI兼容API,Cursor、Claude Code、Aider、LangChain直接无缝对接

本地优先、视觉+音频多模态都支持,想在Mac上爽跑大模型的, 这波强烈建议试试!

在 X 看原帖 ↗

Google把AI Agent部署流程做成了编程助手能调用的技能包

AITOOLINFRA
3.3K134943

做 AI Agent Demo 不难,难的是把它真正部署到云上:环境、评估、CI、数据接入,每一步都能劝退人。Google 开源的 agents-cli,思路是把这些工程化流程做成 AI 编程助手可以调用的技能包。GitHub: 它可以接入 Claude Code、Gemini CLI、Codex 等工具,让编程 Agent 帮你完成脚手架搭建、模型评估和云端部署。

也可以脱离 AI 助手单独运行,用命令行完成数据接入和持续集成相关操作。如果你不是只想做一个 Agent Demo,而是想把它往真实项目里推进,这个项目值得关注。

在 X 看原帖 ↗

AI没干掉软件公司,反而让基础设施厂商业绩超预期

AIOPINIONBUSINESS
2.6万1215611

AI 本该消灭所有软件公司,然而优质基础设施供应商却超越了其第一季度共识预期,并上调了全年营收指引。 并非所有软件都生而平等。

在 X 看原帖 ↗

AI炒股工具不用API就能跑,连mock数据都配好了

开源工具量化交易
8.1K2880151

又挖到一个股票分析开源神器!🔥 AlphaGBM Skills 直接把你的 AI(Claude / Cursor)秒变带真实数据的 quant 交易大脑! 再也不用担心 LLM 胡编 Greeks、IV Rank、期权策略了—每一条数据都来自真实市场,可验证、可实战!

神亮点:
29 个超强技能:股票深度分析、期权 0-100 评分、IV Rank、波动率曲面、Greeks 计算、Unusual Flow、智能对冲、P&L 模拟、回测、投资 Thesis 自动监控……全链路闭环!

零门槛上手
一行命令 clone,无需 API Key 就能用内置真实 mock 数据(AAPL、NVDA、TSLA 等)。

覆盖超广
美股 200+、港股、A股 ETF、商品期货,真正能打。

实战党福音
10K+ 交易者已经在用,AI 自动链式调用,从分析 → 评分 → 策略 → 模拟,一气呵成。

在 X 看原帖 ↗

全AMD训练的8B模型,数学能力逼近大模型

AI开源模型
13.4万29427177

这太疯狂了。一家美国初创公司完全基于 AMD 硬件训练出一款开源的 8B 推理模型 ZAYA1-8B。约 7 亿活跃参数,采用 Apache 2.0 许可协议。

而且它已在数学任务上展现出媲美巨型模型的实力。

在 X 看原帖 ↗

推特用户调侃称学会某技能后Claude和GPT将调用人类

AI社交媒体幽默
11.3万311.7K47

推文写道:‘都学会的话claude和gpt都得直接调用你了’,并附带一个短链接

该推文未解释‘都学会’指代何种知识、技能或工具,未描述调用机制、技术原理或实现路径,也未提供任何截图、代码、文档或第三方验证信息。

推文末尾提及两个账号:@ColorfulToilet(昵称‘马桶爹’)和@ninthbit_ai,并附有‘哈哈哈哈哈哈’表情化回应,整体语境为网络玩笑,无实质技术陈述或事实主张。

在 X 看原帖 ↗

Steve Lauda 探索品牌方向微调的早期对齐

品牌战略社交媒体
1.6K24711

早期探索,旨在尽早就品牌方向的微调达成一致。

@PickleNik0864 是的,长官!

在 X 看原帖 ↗

Gemini Omni视频生成提示词5大实用技巧

AI工程商业
8.6K154585

Google推出Gemini Omni实现文生视频,但需掌握文化符号调用、文字特效控制、镜头指令、局部修改等提示词方法。

阅读全文 →

Brad Mills 开发 Hermes 智能体基础技能集

AI工程开源
4.1K25572

今天,Brad Mills 为其新部署的 Hermes 智能体构建了一套基础技能熟练度体系。

Tidy 表示工作区卫生能力,即保持环境无冗余、无混乱;
Methodical 表示为智能体编写操作手册(playbook)与标准作业程序(SOP)的能力;
Helpful 表示为人编写操作手册与标准作业程序的能力;
Thorough 表示将上述成果发布至 GitHub 的能力,对应仓库链接为

Brad Mills 在推文中邀请 @rot13maxi 让其智能体审阅该技能集。
他还抄送 @Teknium,提问:是否应将此类基础技能集(‘101’级)作为智能体出厂默认配置?

在 X 看原帖 ↗

教程:5步接入OpenRouter的23个大模型

教程AI开源
1.4万44016

扒皮哥第三弹介绍如何接入OpenRouter平台提供的23个大模型。整个过程共5步。

第一步:访问 注册一个OpenRouter账号。

第二步:登录后点击右上角头像,进入 Profile 页面,再选择 API keys 选项。

第三步:在 API keys 页面创建一个新的 API key。至此,OpenRouter端配置完成。

第四步:打开已安装的 Hermes Web UI,点击“模型”选项,再点击“添加模型”,填入模型配置链接

第五步未在原文中明确写出,但根据上下文逻辑,应为完成配置后即可在Hermes中调用OpenRouter所支持的23个大模型。

用户 @libapi_ 表示体验顺畅。用户 @btc_juanmao 请求协助学习相关脚本。

在 X 看原帖 ↗

AI Agent完成上市公司首次覆盖报告文字部分

AI金融自动化
1.0万45836

今天,用户@yuyy614893671让其AI Agent撰写某上市公司的首次覆盖报告,称文字部分“太清晰、太有条理”。

该Agent在文字表达上展现出较强结构化能力,但图表制作和财务模型建模水平仍需提升,用户需人工检查。

报告包含估值部分,涉及不同折现率的选择——过去需耗费较长时间思考,而AI已能快速生成形式完备的估值框架。

AI还生成了敏感性分析表,基于增长假设与权益折现率构建模型。

@golden_pan1评论指出:撰写形式规范的报告已不再稀缺;核心竞争力转向判断力,以及对盈利驱动因素或风险因子的快速识别。

@LeeFisun补充说明:该Agent基座为Gemini,但需接入用户自有数据库、skills,并通过claw等工具进行复杂配置。

在 X 看原帖 ↗

AI代理需用Proton Pass保障安全

安全AI工具
2.0万12165190

任何运行 AI 代理却未使用 Proton Pass 来管理代理的人,等于主动邀请黑客攻击。我们的工作流是:Mr. @Grok → 类似 And OpenClaw 的系统 → Proton Pass。全程受控且安全。

@vnovak_404 @grok Vikror,这只是我对自用产品的推荐。我与该公司无任何合同关系,也不认识该公司任何人。

在 X 看原帖 ↗

Blackgirlbytes重启Twitter Spaces聚焦真实AI工作流

AI工程社区
3.1K205815

嘿各位!我重新启动 Twitter Spaces 啦~哈哈。
这个系列将聚焦于「来自可信开发者的真正 AI 工作流」。

首位嘉宾:独一无二的 Angie Jones(@techgirl1908)!
她将分享:
✅ 她如何在面试中考察 AI 技能
✅ 她个人的 AI 工作流
✅ 跨组织推进 AI 的实用建议

时间:6 月 5 日,太平洋时间中午 12 点 / 东部时间下午 3 点

@ChaiWithJai 哈哈哈同感。X 是啥?😂

@LawrenceDCodes @techgirl1908 到时候见!

@HenriHelvetica @techgirl1908 这正是大家需要的!!

@Ace_KYD @techgirl1908 耶!超期待在现场见到你

@ConorBronsdon @techgirl1908 耶!我也是!

在 X 看原帖 ↗

港大开源AI视频生成工具ViMax,一键生成带货视频

AI开源工程
7.3K2095116

港大最新开源的 AI 视频神器 ViMax 真的太牛了! 不管是跨境电商 带货视频 还是AI短剧自动生成,它都能完美搞定! 今天给大家实测的是带货视频的生成~ 输入一句话商品描述,它就能自动走完全流程: 自动写爆款带货脚本 自动生成专业宫格分镜提示词 自动分镜 + 多镜头切换

@0X_4444 嗯嗯 电商带货那些很火的

@hyyuan99 可以试试哈~

@eastweb3eth 是的 尼卡 可以试试哈

@charles48011843 嗯嗯 对的 charles老师

@panExorcist 谢谢哈 我是做成了网站哈~

@0xLin88 嗯嗯 对的

@spicycandy00 哈哈 可以的 糖宝~

@xx03199 厉害哦 这猴子头像不错 哈哈

@YuGuan1209 嗯嗯 是的 鱼人老师

@Supers6061 哈哈 下次可以开搞跨境电商了

@Michell49473040 seed

在 X 看原帖 ↗

Claude Design 与Claude AI/Code共享使用额度

AI产品设计工程
2.5万12129102

Claude Design 现在和 Claude AI 网站以及 Claude Code 共享额度了,之前是独立的额度,一不小心就没了。 这个产品推荐多用用,产品设计能力和 UI 设计能力挺不错的。 一个经验就是你先让它帮你定义一套设计系统(Design System),打磨好了后,基于设计系统去设计 UI,一致性会好很多

@agmugei 你看我截图顶部,以及你去看一下 Claude AI 的usage

@lxfater 搜索 Design System,资料很多很多

在 X 看原帖 ↗

小米MiMo v2.5模型以高性价比引发关注

AI开源工程
1.9万1116345

哇。看起来 @XiaomiMiMo v2.5 模型的性价比简直惊人 :O(每个回答后都标出了该次 prompt 的价格。上下文包含超 40k 条工具描述、系统提示、技能等。)

缓存效果也很惊艳……

在 X 看原帖 ↗

Codex+GPT-5.5实战课上线:2小时手把手教学

AI工程教程
5.3K247668

Codex 最强实战课重磅上线,建议直接收藏。 短短不到2小时,就能带你吃透 Codex + GPT-5.5 这套超强“AI开发外挂”: 从技能与插件基础配置、自动化工作流完整搭建,到多任务并行实操,全程一步一步手把手演示。 想快速掌握高效实用的 Vibe Coding 技巧,这条免费中文实战教程,绝对是当下最值得刷的。

@hisevenih 感谢支持

在 X 看原帖 ↗

用好Coding Agent的关键在需求分析与规划阶段

AI工程研究
3.0万55288295

用好 Coding Agent,重点是两头,尤其是开头的部分,如果一开始就走偏了后面怎么改都改不好。 比如我要开发一个新功能,首先不是直接叫给 Agent 去写,会把需求简单整理一下,发给三个不同的 Agent(Codex、Claude Code、Cursor),打开 Plan 模式去帮我写 Plan,这里要用最好的模型。

@duange6099 不一定

@aceeveryserve 是,除了发散视野,还有隔离上下文也很有价值。 最终交付还是得收束

在 X 看原帖 ↗

AI现在读文档,居然比人还挑——只看关键段落就答对了

AIRESEARCH
1621

大窗口 LLM 与两步向量搜索的基准测试
关键在于:最聪明的系统实际上读得更少。

我针对文档 AI 测试了三种方法:
- 全上下文提示(Full-context prompting)
- 标准 RAG
- 基于 Qdrant 的两步向量搜索

结果非常出色。
无需处理 50k+

在 X 看原帖 ↗

你本地装个App,3秒录个音就能克隆声音,连服务器都不用连

TOOLLAUNCH
6.9K16139198

OmniVoice Studio 是一款开源桌面应用,支持实时听写、零样本语音克隆和视频配音,完全在本地运行,无需 API 密钥。

- 仅需 3 秒音频片段,即可克隆任意声音,覆盖 646 种语言
- 可精细调节语音属性,包括性别、年龄、口音、音高和情绪
- 支持通过 YouTube 网址或本地文件导入视频,并完成翻译与重新配音
- 提供 macOS、Windows 和 Linux 桌面版

在 X 看原帖 ↗

Meta要派工程师住进客户公司,手把手教他们用自家AI

NEWS商业
1.9K134

备忘录:Meta 计划组建一个新的“企业解决方案”(Enterprise Solutions)部门,将工程师和产品经理派驻到大型企业客户内部,以协助部署其 AI 工具。(@jyoti_mann1 / The Information)

(访问 Techmeme.com 获取链接及完整背景!)

在 X 看原帖 ↗

有人把AI运行时的每一步操作都存下来,结果真挖出了自动化新线索

TOOLAI
9.3K7100117

Agent 追踪记录(traces)是新的金矿。它们被用于发现失败模式、调优提示词(prompts)、减少 token 浪费、提升评估效果(evals),以及决定下一步该自动化什么任务。

所以我开发了 Tracebase:一个本地开源(OSS)平台,可免费追踪、搜索和分析你本地的 Codex/Claude 追踪记录。

(1/9)

在 X 看原帖 ↗

科学家刚给蛋白质建了个‘世界模型’,但连它怎么干活都还不知道

LAUNCHRESEARCH
1.4万3915561

蛋白质是生命的机器。科学家已编录了数十亿条蛋白质序列——但它们的生物学功能大多仍属未知。

今天,我们发布了一个蛋白质生物学的世界模型:一个由 ESMFold2、ESMC 和 ESM Atlas 构成的科学引擎,用于预测、设计与发现。

这三者协同工作,正帮助研究人员开辟一种设计蛋白质的新路径,并加速科学发现。

我们的使命是治愈或预防疾病。要实现这一目标,我们必须加速科学进程。

正因如此,我们将这三项技术全部开源发布。

在 X 看原帖 ↗

点一下就给3D模型上色?AI纹理工具上线了

AI Texturingthreejs
1.4万27247306

我们刚刚推出了 AI 纹理生成功能 🎉
创建或导入一个 3D 模型,然后一键生成纹理。

立即试用:
项目源代码:
#threejs #kokraf #BuiltInPublic

在 X 看原帖 ↗

本地机器人聊天快到要加延迟

机器人本地AI
4.1万38227197

推出本地版 Reachy Mini 对话功能:永久免费聊天!
速度快到我们必须硬编码延迟,以免它在你说话中途就打断你。

我们构建了一个开源实时 API,由 llama.cpp 驱动:
Parakeet → Gemma 4 E4B → Qwen3TTS。
可在任何运行本地大模型(LMs)的设备上运行。

视频展示了 DGX Spark 和一台配备 36GB 内存的 M3 Pro MacBook。

博客:

在 X 看原帖 ↗

VS Code里直接用Grok Build,不用买token

开发者工具AI集成
1.8万89485156

从今天开始,你还可以直接在 Kilo Code(开源的智能体 IDE)中使用你的 𝕏 Premium+ 或 SuperGrok 订阅。
无需单独配置 API 密钥……也无需按 token 付费。

你只需连接你的账户,即可立即在 VS Code、JetBrains 或终端中调用最新的 Grok 模型(包括 Grok Build)。

将 Kilo Code 的智能体规划能力与浏览器自动化功能,和 Grok 的超大上下文窗口相结合,对开发者而言简直是开挂般的体验。

xAI 正在悄然构建终极开发者生态系统。

在 X 看原帖 ↗

Krea 2 API上线,Claude和Codex都能调用

AI图像生成API
7.5万25316168

今天,我们正式发布 Krea 2 的 API。
现已可在 @fal 或 @ComfyUI 等平台使用,
也可通过 @NousResearch 推出的 Hermes 等智能体调用,
并全面支持 Claude、Codex 和 OpenClaw。

了解如何配置 👇

在 X 看原帖 ↗

30分钟人类第一视角视频,就能教会机器人干活

机器人学习开源框架
1.4万39258191

30 分钟视频。机器人学会该任务。开源,端到端。

一个开源框架,仅需通过 Meta Aria 眼镜采集的 30 分钟人类第一人称视频,即可训练机器人策略:实现零样本迁移至真实机器人,且无需收集任何机器人数据。

该方法依赖“以交互为中心的 Token”(Interaction-Centric Tokens),对表征手-物空间关系的特征进行编码,使其在具身形态和视角变化下保持不变;并辅以物体运动预测、潜在一致性等辅助目标,从相同数据中提取更丰富的监督信号。

HumanEgo 在双手协同任务上展现出强大的跨具身、跨环境性能,表现优于 ACT 和遥操作数据等基线方法,且仅需单块 RTX 4090 GPU 即可完成训练。

感谢分享,@TX_Leo_Wang。
📌 网站:
论文:
代码:
视频:

——
每周机器人与 AI 洞见。免费订阅:

在 X 看原帖 ↗

AI情商测试第一次用真人真实感受打分

AI测评情感计算
8.1K149953

1/ 今天我们发布了 AttuneBench——首个基于真实多轮人机对话的开源情商(EQ)基准测试,其评分依据是人在每一轮对话中实际感受到的情绪和真实需求。该基准由 @pareto_ai 研究团队与 @thoughtfullab 合作构建。

目前大多数现有情商基准测试依赖于:
- 合成提示(synthetic prompts)
- 单轮交互(single-turn interactions)
- 第三方标注(third-party annotation)

没有任何一个基准直接衡量模型在完整对话过程中如何感知并响应真实用户的情绪与意图。

我们评估了来自主流厂商的 11 个领先模型,覆盖 200 场对话及 50,000 多条第一人称标注数据。

在 X 看原帖 ↗

Hermes Kanban上线:将Hermes智能体工作流可视化

AI工程工具
3.9K57662

你是否曾希望能在Hermes智能体上查看并配置一套规范的可视化工作流?Hermes Kanban将智能体工作流变为真正可‘看见’的形式——把宏大目标转化为清晰、可执行的具体任务,并支持为每项任务指派合适的智能体或领域专家。

链接指向功能落地页:

用户@iMichaelTen评论:“非常好的想法!我之前让Hermes为我构建了一个,但每次更新都得重新创建一个。”

用户@tonysimons_评论:“不错!很高兴你正在充分利用它。”

用户@AURELIANbuilds评论:“冲啊!听起来你已经完全掌握了。”

用户@israfill评论:“太美了。”

用户@carlosprada0x评论:“很喜欢这个视觉设计!”

用户@moikapy评论:“非常棒。”

在 X 看原帖 ↗

用户称因推广Clanker Cloud遭LinkedIn永久限制

社交平台账号限制Clanker Cloud
1.1K2651

用户@tekbog在𝕏(原Twitter)发帖称,其账号因推广Clanker Cloud而被LinkedIn施加永久‘underclass’限制。

该用户强调,自己并未使用任何自动化工具操作LinkedIn,仅进行常规点击和新开浏览器标签页等人工操作。

帖文附有一条短链接(

另一用户@d3layd在回复中表示,目前甚至无法登录LinkedIn账户。

在 X 看原帖 ↗

AI未必加剧权力集中与威权主义的四个理由

AI政治影响开源
4.0万1711553

以下是我不确信AI将加剧权力集中并助长威权主义的四个理由,尽管这种可能性确实存在。(1)AI具有竞争性和分散性。开源模型正展现出高度能力。这意味着没有单一模型能决定我们能做什么或不能做什么,因为我们拥有多种替代方案。

(2)多位评论者指出,算力、能源和数据中心可能构成新的集中化瓶颈,但目前尚无证据表明这些要素已形成不可逾越的壁垒或单一控制点。

(3)有研究评估了大模型对威权主义指令的响应,结果显示现有模型在相关测试中表现不足,但该评估本身被作者明确认定为“严重不充分”,无法支撑确定性结论。

(4)历史经验显示,技术影响并非单向:例如阿拉伯之春期间对社交媒体的乐观预期事后被证明过于高涨,说明技术与政治结果之间不存在简单因果关系。

在 X 看原帖 ↗

SAERL用稀疏自编码器激活指导大模型训练数据工程

AI可解释性强化学习
7.8K16131116

新方法SAERL从LLM内部激活中直接提取多样性、难度和质量信号,替代昂贵的外部评估,在数学推理RL任务中提升准确率3%、加速训练20%。

阅读全文 →

Cognition融资超10亿美元,估值260亿美元

AI商业工程
56.4万1782.1K383

AI软件工程公司Cognition宣布完成超10亿美元融资,估值达260亿美元。

阅读全文 →

开源AI学习工具:输入主题自动生成完整课程

AI开源教育
38.7万2113099

我开发了一款开源工具,用 AI 辅助学习任何内容:
- 输入你想学的东西
- 它会为你生成一门完整课程

你可以从零基础起步,逐步掌握任意学科,哪怕是量子物理这类复杂主题。
它提供三种学习格式:
- 解释(Explanation):短小精悍的课时

免费试用地址:
如果你喜欢它并希望订阅,可使用优惠码 X30,永久享受 7 折优惠(不仅首月,而是终身),该优惠码于 6 月 30 日过期。

你也可以在本地运行它,或自行托管(MIT 许可证,可随意使用)。详情见:

它采用如下技术栈:
- @nextjs
- @better_auth
- @shadcn
- @tailwindcss
- @aisdk
- @workflowsdk
- Postgres 配合 @prisma ORM

大部分任务……

在 X 看原帖 ↗

ESMFold2发布:开源蛋白结构与互作预测引擎

AI生物计算开源
24.3万3311.2K532

ESM团队推出开源科学模型ESMFold2,支持蛋白结构预测、设计及相互作用建模,尤其在抗体靶向识别上达SOTA。

阅读全文 →

Webflow 要为「自主代理」网页进化了

WebflowAgentic Web

Evolving Webflow for the Agentic Web

在 HN 看讨论 ↗   原文 / 论文 ↗

AI团队自动找漏洞还复现——不用人点鼠标

AI安全多智能体

面向自动化漏洞发现与复现的多智能体大语言模型系统

在 HN 看讨论 ↗   原文 / 论文 ↗

AI代理根本改不了软件系统

AI代理软件系统

Why AI Agents Cannot Change Software Systems

社区讨论:多人指出LLM在局部任务(如单函数编写)中有效,但系统级修改会积累“slop”(@christkv、@jvanderbot);@lubujackson强调AI需通过人类意图编码的技能链协同工作,而非自主决策;@dvh质疑成本分摊——AI生成PR的token开销无人承担后续维护;@adamtaylor_13类比为“外骨骼而非机器人”,必须经人工审查。@antirez则嘲讽“文本预测”论已过时。

在 HN 看讨论 ↗   原文 / 论文 ↗

Anthropic和OpenAI真找到产品市场契合点了?

AI产品市场契合

我认为 Anthropic 和 OpenAI 已经找到了产品-市场契合点。

社区讨论:多人质疑Anthropic与OpenAI的盈利真实性,@hansmayer指出其“首度盈利”传闻依赖非GAAP会计手段,将未实现收入计入财报;@dude250711追问该季度是否含临时基础设施折扣。@binary0010以实际案例说明企业正转向GLM-5.1等开源模型,因成本更低且性能相当;@sourcecodeplz补充DeepSeek、小米Mimo模型降价99%进一步压缩高价闭源模型空间。@realo则反驳价格敏感论,称$200/月远低于传统CAD等专业软件许可费。

在 HN 看讨论 ↗   原文 / 论文 ↗

GLM、Qwen、DeepSeek这些国产模型,现在能直接塞进你的AI工作流里了

LAUNCHAI
8.5K19879

你的 AI 入口刚刚扩容了。
图像生成功能现已上线。

除了 Claude、GPT 和 Gemini,全新的开源前沿模型也已触手可及:GLM、MiniMax、Qwen、DeepSeek 等,全部接入同一个端点。

一把钥匙,通达所有模型。
现在,还支持图像。

试试 Based AI:Stay Based。

在 X 看原帖 ↗

网易有道把TTS引擎单独开源了,营销人录3秒声音就能生成14种语言配音

LAUNCHAI
1.5万1789101

网易有道「子曰4」全模态大模型来了,权重全量开源 这次「子曰4」不仅支持了多模态:图像/视频/语音全输入,27B可以本地化部署,尤其在学习场景表现优异 更值得一提的是这个 TTS 引擎独立开源,3秒即可完成声音采样,克隆音色,并支持14种语言的跨语种生成,且跨语种无口音。这对于我们做音视频营销素材跨语种分发的营销人而言,绝对是个利好 我尝试了一下用我自己的声音来朗读日语,感觉效果还挺好的,最重要的是生成快!大家可以看视频感受一下 等github把模型全开源出来后,我准备封到牛马AI里跑视频素材跨语种合成了!

TTS试玩 TTS项目地址 多模态模型

在 X 看原帖 ↗

谷歌DeepMind、苹果、OpenAI的人一起创业,做的却是让企业AI不停学新东西的平台

NEWSAI
2.2万1015585

新消息:来自 Google DeepMind、Apple、MSL 和 OpenAI 的一组 AI 研究人员正联合创办一家名为 Trajectory 的新创公司,旨在为企业构建持续学习平台。

该公司已获得 1500 万美元种子轮融资,投资方包括 Sarah Guo 创立的 Conviction 基金、Jeff Dean、Fei-Fei Li 等人。

在 X 看原帖 ↗

改个税错误,AI自己追着修系统

Codex税务AI
2.1万32362224

⚙️ 自我改进型税务代理的构建幕后
我们与 @ThriveHoldings 合作构建了 Tax AI,聚焦于报税准备工作流。

当审核人员修正任何错误时,Codex 能够追溯故障根源、改进系统,并在变更上线前完成测试。

在 X 看原帖 ↗

25个真实系统架构模板,连AI编码产品都拆解了

架构设计AI产品
2.6万103495605

开源架构知识库,收录 25 个真实系统架构模板和一套系统化架构思维教程。 这个仓库不讲代码,只讲架构。收录了 25 个热门系统的架构模板,从电商、社交信息流、支付到 AI 网关、RAG、AI Agent,再到 Claude Code、Codex 等 AI 编码产品,每个模板拆解核心决策和常见坑。

在 X 看原帖 ↗

AI写真提示词关键在多维控制而非关键词堆砌

AI图像生成提示工程
4.1K25442

兄弟们,刚用这个GPT Image 2的写真助手模板,测试了一组「夜色情绪 × 高级可爱风卧室」提示词。效果依然很能打😆

这类提示词的关键,不是写“性感”两个字,而是控制好:
- 氛围感
- 服装材质
- 人物姿态
- 光线情绪
- 身体线条
- 镜头距离

当这些元素统一起来,画面才会有真实写真感,而不是廉价摆拍感。

AI 写真提示词真正难的地方,往往不是堆关键词,而是让风格、人物、姿态、服装、光线与构图协调一致。

@duange6099 那就不是写真了,写真本来就比较假

在 X 看原帖 ↗

用ChatGPT-Image2生成4张内衣详情页氛围图

电商AI图像生成营销
1.1万148452

💗用ChatGPT-Image2扩展《内衣电详情页》,深酒红黑蕾丝款氛围图! 用4张成交氛围图提升详情页转化率✈️

1、深酒红蕾丝+透肤丝袜穿搭
2、蕾丝花纹&玫瑰金细节特写
3、背部肩带与流畅腰线
4、成套产品精致平铺

电商图不只是讲功能,更要把让用户心动、想买的氛围感做足!

提示词在评论区👇

《内衣详情页氛围图》提示词: 【统一要求】

⚠️ 必须输出合法 JSON,不要加注释或 markdown 标记。

在 X 看原帖 ↗

Xiaomi Mimo AI订阅界面模型名大小写不一致致Claude配置失败

AI产品体验工程
1.5万35417

吐槽下Xiaomi Mimo AI的订阅管理界面,我按照你写的参数设置,最后Claude显示是参数错误。

我再打开你的Claude设置,才发现你订阅界面写的模型是MiMo-V2.5-Pro,但Claude设置必须设置为mimo-v2.5-pro才行。

咋产品经理自己不走一圈就发布网页?

@xmaxxie1119 是,只要他们产品经理哪怕用一下自己的模型,也会发现问题。

在 X 看原帖 ↗

开发者完成Meridian Agent后沉迷编码,顺手构建天气代理仪表板

AI开源工程
1.9K35613

完成@meridian_agent开发后,作者表示自己已陷入‘编码氛围感’成瘾状态,并同步完成了天气代理(weather agent)的仪表板构建。

作者特别致谢@0xyunss(昵称bubub),因其提供了为期一年的免费大语言模型(LLM)服务,称该资源价值等同于20美元的Claude Sonnet订阅;该资源被用于构建Opus工作流,并生成结构化文档struktur.md,其余代码编写使用Claude Code。

文中附有两个链接:一是Meridian Agent与@0xyunss关联的Meridian仪表板(

多条回复中,多位用户(@ali111sama、@fachriceg、@BigBossXCV、@ahtjong888、@noela_zee、@brother_jam35)向@meridian_agent和@0xyunss表达感谢;@eindrasap评论称‘效果很丑’;@kiippllii提及‘Polymarket与天气相关’。

在 X 看原帖 ↗

提示工程与普通提示有本质区别

AI工程科普
2.1K4653

AI 系列 - 第 04 期:提示工程到底是什么?如果你曾好奇成为提示工程师意味着什么,以及设计一个提示需要哪些能力,其核心归结为一点:提示工程与普通提示存在真实差异。

两者是截然不同的实践。链接指向相关说明(

@ChemistDeFi 回复称‘那样会更好,我同意’,并补充‘但我真心不想承受那种压力’。

@OnyiEth 回复‘感谢你,Onyi’。

在 X 看原帖 ↗

10句提示词可显著提升Claude、ChatGPT和Gemini输出质量

AI工程研究
1.7万1365121

原文列举10个具体提示短语,每句对应一种认知操作(如反向思考、质疑假设、指出盲点),均直接作用于AI响应的深度、严谨性与创造性。

阅读全文 →

LiteParse v2发布:号称全球最快且最准确的开源无模型PDF解析器

AI开源工程
11.2万911.1K1.2K

我们创建了全球最快的PDF解析器⚡️。它比当前所有其他开源、无模型(model-free)PDF解析器更准确,包括pymupdf、pypdf、markitdown、pdftotext、opendataloader和pymupdf4llm。

推出LiteParse v2——我们已将整个库用Rust语言重写。项目链接:

该工具完全开源且免费。

@davielam_ 您这里是否有示例文档?我们将用于迭代优化核心功能。

在 X 看原帖 ↗

LLM记忆越强,越难模拟真实用户行为

AI认知科学人机交互
1.4万31188110

新研究指出,当前LLM记忆能力过强导致其作为用户模拟器(如模拟学生)失真,需引入类人遗忘机制。

阅读全文 →

当前缺乏对自主编程工具生产力影响的可靠实证研究

AI研究工程
4.3万4770586

据我所知,我们目前尚无任何良好的测试来评估自2025年12月起陆续出现的自主编程工具对生产力的实际影响。所有已发表的论文均出自Claude Code/Codex革命之前。我们在理解当前编程领域正在发生什么这件事上,存在巨大知识空白。

最接近的相关研究是METR于2026年2月发布的非常初步的更新,但其数据质量不足以支撑任何实质性结论。这显然是一个极高风险、高重要性的问题,而我们却掌握极少实证数据(只有大量推测性的Substack文章)。

@PingPlusAI 哦,这提示词简直糟糕透顶

@Ferbin08 我讨厌你的提示词

在 X 看原帖 ↗

How LLMs Actually Work:可视化交互式大模型工作链路教程

AI科普工程
3.9K197594

想弄懂大模型怎么工作,很多资料不是太论文,就是只讲“模型会预测下一个词”这种概念,真正的完整链路反而看不清。 How LLMs Actually Work 把大语言模型从原始互联网文本到聊天助手的过程,做成了一个可视化、交互式教程。 GitHub: 内容基于 Andrej Karpathy 的《Intro to

我用夸克网盘给你分享了「AI全套攻略(持续更新中)」

@wangchangfu88 😁😁😁

在 X 看原帖 ↗

Pi Agent原理与实现教程:从零构建AI Agent

AI工程教程
1.6万32160173

Codex 提示词: 请帮我完成一个详细的教程,主题是 「 Pi Agent 的原理与实现:从零到一实现一个 AI Agent」。 参考 [earendil-works/pi]( 和 等,进行联网搜索,先完整理解它的核心原理、架构设计、关键模块和实现链路,然后为它生成一个基于

@wsl8297 哈哈哈 大家一起搞流量

在 X 看原帖 ↗
🚀 新品发布

全AMD训练的8B模型,数学能力逼近大模型

AI开源模型
13.4万29427177

这太疯狂了。一家美国初创公司完全基于 AMD 硬件训练出一款开源的 8B 推理模型 ZAYA1-8B。约 7 亿活跃参数,采用 Apache 2.0 许可协议。

而且它已在数学任务上展现出媲美巨型模型的实力。

在 X 看原帖 ↗

30分钟人类第一视角视频,就能教会机器人干活

机器人学习开源框架
1.4万39258191

30 分钟视频。机器人学会该任务。开源,端到端。

一个开源框架,仅需通过 Meta Aria 眼镜采集的 30 分钟人类第一人称视频,即可训练机器人策略:实现零样本迁移至真实机器人,且无需收集任何机器人数据。

该方法依赖“以交互为中心的 Token”(Interaction-Centric Tokens),对表征手-物空间关系的特征进行编码,使其在具身形态和视角变化下保持不变;并辅以物体运动预测、潜在一致性等辅助目标,从相同数据中提取更丰富的监督信号。

HumanEgo 在双手协同任务上展现出强大的跨具身、跨环境性能,表现优于 ACT 和遥操作数据等基线方法,且仅需单块 RTX 4090 GPU 即可完成训练。

感谢分享,@TX_Leo_Wang。
📌 网站:
论文:
代码:
视频:

——
每周机器人与 AI 洞见。免费订阅:

在 X 看原帖 ↗

Krea 2 API上线,Claude和Codex都能调用

AI图像生成API
7.5万25316168

今天,我们正式发布 Krea 2 的 API。
现已可在 @fal 或 @ComfyUI 等平台使用,
也可通过 @NousResearch 推出的 Hermes 等智能体调用,
并全面支持 Claude、Codex 和 OpenClaw。

了解如何配置 👇

在 X 看原帖 ↗

VS Code里直接用Grok Build,不用买token

开发者工具AI集成
1.8万89485156

从今天开始,你还可以直接在 Kilo Code(开源的智能体 IDE)中使用你的 𝕏 Premium+ 或 SuperGrok 订阅。
无需单独配置 API 密钥……也无需按 token 付费。

你只需连接你的账户,即可立即在 VS Code、JetBrains 或终端中调用最新的 Grok 模型(包括 Grok Build)。

将 Kilo Code 的智能体规划能力与浏览器自动化功能,和 Grok 的超大上下文窗口相结合,对开发者而言简直是开挂般的体验。

xAI 正在悄然构建终极开发者生态系统。

在 X 看原帖 ↗

本地机器人聊天快到要加延迟

机器人本地AI
4.1万38227197

推出本地版 Reachy Mini 对话功能:永久免费聊天!
速度快到我们必须硬编码延迟,以免它在你说话中途就打断你。

我们构建了一个开源实时 API,由 llama.cpp 驱动:
Parakeet → Gemma 4 E4B → Qwen3TTS。
可在任何运行本地大模型(LMs)的设备上运行。

视频展示了 DGX Spark 和一台配备 36GB 内存的 M3 Pro MacBook。

博客:

在 X 看原帖 ↗

点一下就给3D模型上色?AI纹理工具上线了

AI Texturingthreejs
1.4万27247306

我们刚刚推出了 AI 纹理生成功能 🎉
创建或导入一个 3D 模型,然后一键生成纹理。

立即试用:
项目源代码:
#threejs #kokraf #BuiltInPublic

在 X 看原帖 ↗
📰 行业动态

苹果M芯片跑大模型,首token延迟压到0.08秒

AITOOLEXPERIENCE
1.8万28148188

用苹果电脑跑本地大模型的兄弟注意了! 有个东西你们可能还没用上 —— Rapid-MLX 专门为 Apple Silicon(M系列芯片)打造的本地LLM推理服务, 核心就一句话: 比 Ollama 明显快很多,官方实测2-4倍加速!

用的是苹果官方MLX框架,吃透了M芯片架构。 主要狠在:
1、多轮对话首token延迟压到0.08秒左右,几乎感觉不到等待
2、工具调用做了17种智能解析器,Qwen、DeepSeek、Gemma等模型自动适配,量化坏了也能自动修复
3、原生OpenAI兼容API,Cursor、Claude Code、Aider、LangChain直接无缝对接

本地优先、视觉+音频多模态都支持,想在Mac上爽跑大模型的, 这波强烈建议试试!

在 X 看原帖 ↗

Google把AI Agent部署流程做成了编程助手能调用的技能包

AITOOLINFRA
3.3K134943

做 AI Agent Demo 不难,难的是把它真正部署到云上:环境、评估、CI、数据接入,每一步都能劝退人。Google 开源的 agents-cli,思路是把这些工程化流程做成 AI 编程助手可以调用的技能包。GitHub: 它可以接入 Claude Code、Gemini CLI、Codex 等工具,让编程 Agent 帮你完成脚手架搭建、模型评估和云端部署。

也可以脱离 AI 助手单独运行,用命令行完成数据接入和持续集成相关操作。如果你不是只想做一个 Agent Demo,而是想把它往真实项目里推进,这个项目值得关注。

在 X 看原帖 ↗

AI没干掉软件公司,反而让基础设施厂商业绩超预期

AIOPINIONBUSINESS
2.6万1215611

AI 本该消灭所有软件公司,然而优质基础设施供应商却超越了其第一季度共识预期,并上调了全年营收指引。 并非所有软件都生而平等。

在 X 看原帖 ↗

AI现在读文档,居然比人还挑——只看关键段落就答对了

AIRESEARCH
1621

大窗口 LLM 与两步向量搜索的基准测试
关键在于:最聪明的系统实际上读得更少。

我针对文档 AI 测试了三种方法:
- 全上下文提示(Full-context prompting)
- 标准 RAG
- 基于 Qdrant 的两步向量搜索

结果非常出色。
无需处理 50k+

在 X 看原帖 ↗

你本地装个App,3秒录个音就能克隆声音,连服务器都不用连

TOOLLAUNCH
6.9K16139198

OmniVoice Studio 是一款开源桌面应用,支持实时听写、零样本语音克隆和视频配音,完全在本地运行,无需 API 密钥。

- 仅需 3 秒音频片段,即可克隆任意声音,覆盖 646 种语言
- 可精细调节语音属性,包括性别、年龄、口音、音高和情绪
- 支持通过 YouTube 网址或本地文件导入视频,并完成翻译与重新配音
- 提供 macOS、Windows 和 Linux 桌面版

在 X 看原帖 ↗

Meta要派工程师住进客户公司,手把手教他们用自家AI

NEWS商业
1.9K134

备忘录:Meta 计划组建一个新的“企业解决方案”(Enterprise Solutions)部门,将工程师和产品经理派驻到大型企业客户内部,以协助部署其 AI 工具。(@jyoti_mann1 / The Information)

(访问 Techmeme.com 获取链接及完整背景!)

在 X 看原帖 ↗

有人把AI运行时的每一步操作都存下来,结果真挖出了自动化新线索

TOOLAI
9.3K7100117

Agent 追踪记录(traces)是新的金矿。它们被用于发现失败模式、调优提示词(prompts)、减少 token 浪费、提升评估效果(evals),以及决定下一步该自动化什么任务。

所以我开发了 Tracebase:一个本地开源(OSS)平台,可免费追踪、搜索和分析你本地的 Codex/Claude 追踪记录。

(1/9)

在 X 看原帖 ↗

科学家刚给蛋白质建了个‘世界模型’,但连它怎么干活都还不知道

LAUNCHRESEARCH
1.4万3915561

蛋白质是生命的机器。科学家已编录了数十亿条蛋白质序列——但它们的生物学功能大多仍属未知。

今天,我们发布了一个蛋白质生物学的世界模型:一个由 ESMFold2、ESMC 和 ESM Atlas 构成的科学引擎,用于预测、设计与发现。

这三者协同工作,正帮助研究人员开辟一种设计蛋白质的新路径,并加速科学发现。

我们的使命是治愈或预防疾病。要实现这一目标,我们必须加速科学进程。

正因如此,我们将这三项技术全部开源发布。

在 X 看原帖 ↗

GLM、Qwen、DeepSeek这些国产模型,现在能直接塞进你的AI工作流里了

LAUNCHAI
8.5K19879

你的 AI 入口刚刚扩容了。
图像生成功能现已上线。

除了 Claude、GPT 和 Gemini,全新的开源前沿模型也已触手可及:GLM、MiniMax、Qwen、DeepSeek 等,全部接入同一个端点。

一把钥匙,通达所有模型。
现在,还支持图像。

试试 Based AI:Stay Based。

在 X 看原帖 ↗

网易有道把TTS引擎单独开源了,营销人录3秒声音就能生成14种语言配音

LAUNCHAI
1.5万1789101

网易有道「子曰4」全模态大模型来了,权重全量开源 这次「子曰4」不仅支持了多模态:图像/视频/语音全输入,27B可以本地化部署,尤其在学习场景表现优异 更值得一提的是这个 TTS 引擎独立开源,3秒即可完成声音采样,克隆音色,并支持14种语言的跨语种生成,且跨语种无口音。这对于我们做音视频营销素材跨语种分发的营销人而言,绝对是个利好 我尝试了一下用我自己的声音来朗读日语,感觉效果还挺好的,最重要的是生成快!大家可以看视频感受一下 等github把模型全开源出来后,我准备封到牛马AI里跑视频素材跨语种合成了!

TTS试玩 TTS项目地址 多模态模型

在 X 看原帖 ↗

谷歌DeepMind、苹果、OpenAI的人一起创业,做的却是让企业AI不停学新东西的平台

NEWSAI
2.2万1015585

新消息:来自 Google DeepMind、Apple、MSL 和 OpenAI 的一组 AI 研究人员正联合创办一家名为 Trajectory 的新创公司,旨在为企业构建持续学习平台。

该公司已获得 1500 万美元种子轮融资,投资方包括 Sarah Guo 创立的 Conviction 基金、Jeff Dean、Fei-Fei Li 等人。

在 X 看原帖 ↗

Anthropic和OpenAI真找到产品市场契合点了?

AI产品市场契合

我认为 Anthropic 和 OpenAI 已经找到了产品-市场契合点。

社区讨论:多人质疑Anthropic与OpenAI的盈利真实性,@hansmayer指出其“首度盈利”传闻依赖非GAAP会计手段,将未实现收入计入财报;@dude250711追问该季度是否含临时基础设施折扣。@binary0010以实际案例说明企业正转向GLM-5.1等开源模型,因成本更低且性能相当;@sourcecodeplz补充DeepSeek、小米Mimo模型降价99%进一步压缩高价闭源模型空间。@realo则反驳价格敏感论,称$200/月远低于传统CAD等专业软件许可费。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI代理根本改不了软件系统

AI代理软件系统

Why AI Agents Cannot Change Software Systems

社区讨论:多人指出LLM在局部任务(如单函数编写)中有效,但系统级修改会积累“slop”(@christkv、@jvanderbot);@lubujackson强调AI需通过人类意图编码的技能链协同工作,而非自主决策;@dvh质疑成本分摊——AI生成PR的token开销无人承担后续维护;@adamtaylor_13类比为“外骨骼而非机器人”,必须经人工审查。@antirez则嘲讽“文本预测”论已过时。

在 HN 看讨论 ↗   原文 / 论文 ↗

AI团队自动找漏洞还复现——不用人点鼠标

AI安全多智能体

面向自动化漏洞发现与复现的多智能体大语言模型系统

在 HN 看讨论 ↗   原文 / 论文 ↗

Webflow 要为「自主代理」网页进化了

WebflowAgentic Web

Evolving Webflow for the Agentic Web

在 HN 看讨论 ↗   原文 / 论文 ↗
⚡ 实战经验

改个税错误,AI自己追着修系统

Codex税务AI
2.1万32362224

⚙️ 自我改进型税务代理的构建幕后
我们与 @ThriveHoldings 合作构建了 Tax AI,聚焦于报税准备工作流。

当审核人员修正任何错误时,Codex 能够追溯故障根源、改进系统,并在变更上线前完成测试。

在 X 看原帖 ↗

25个真实系统架构模板,连AI编码产品都拆解了

架构设计AI产品
2.6万103495605

开源架构知识库,收录 25 个真实系统架构模板和一套系统化架构思维教程。 这个仓库不讲代码,只讲架构。收录了 25 个热门系统的架构模板,从电商、社交信息流、支付到 AI 网关、RAG、AI Agent,再到 Claude Code、Codex 等 AI 编码产品,每个模板拆解核心决策和常见坑。

在 X 看原帖 ↗
📌 其他

AI情商测试第一次用真人真实感受打分

AI测评情感计算
8.1K149953

1/ 今天我们发布了 AttuneBench——首个基于真实多轮人机对话的开源情商(EQ)基准测试,其评分依据是人在每一轮对话中实际感受到的情绪和真实需求。该基准由 @pareto_ai 研究团队与 @thoughtfullab 合作构建。

目前大多数现有情商基准测试依赖于:
- 合成提示(synthetic prompts)
- 单轮交互(single-turn interactions)
- 第三方标注(third-party annotation)

没有任何一个基准直接衡量模型在完整对话过程中如何感知并响应真实用户的情绪与意图。

我们评估了来自主流厂商的 11 个领先模型,覆盖 200 场对话及 50,000 多条第一人称标注数据。

在 X 看原帖 ↗

AI炒股工具不用API就能跑,连mock数据都配好了

开源工具量化交易
8.1K2880151

又挖到一个股票分析开源神器!🔥 AlphaGBM Skills 直接把你的 AI(Claude / Cursor)秒变带真实数据的 quant 交易大脑! 再也不用担心 LLM 胡编 Greeks、IV Rank、期权策略了—每一条数据都来自真实市场,可验证、可实战!

神亮点:
29 个超强技能:股票深度分析、期权 0-100 评分、IV Rank、波动率曲面、Greeks 计算、Unusual Flow、智能对冲、P&L 模拟、回测、投资 Thesis 自动监控……全链路闭环!

零门槛上手
一行命令 clone,无需 API Key 就能用内置真实 mock 数据(AAPL、NVDA、TSLA 等)。

覆盖超广
美股 200+、港股、A股 ETF、商品期货,真正能打。

实战党福音
10K+ 交易者已经在用,AI 自动链式调用,从分析 → 评分 → 策略 → 模拟,一气呵成。

在 X 看原帖 ↗

Pi Agent原理与实现教程:从零构建AI Agent

AI工程教程
1.6万32160173

Codex 提示词: 请帮我完成一个详细的教程,主题是 「 Pi Agent 的原理与实现:从零到一实现一个 AI Agent」。 参考 [earendil-works/pi]( 和 等,进行联网搜索,先完整理解它的核心原理、架构设计、关键模块和实现链路,然后为它生成一个基于

@wsl8297 哈哈哈 大家一起搞流量

在 X 看原帖 ↗

How LLMs Actually Work:可视化交互式大模型工作链路教程

AI科普工程
3.9K197594

想弄懂大模型怎么工作,很多资料不是太论文,就是只讲“模型会预测下一个词”这种概念,真正的完整链路反而看不清。 How LLMs Actually Work 把大语言模型从原始互联网文本到聊天助手的过程,做成了一个可视化、交互式教程。 GitHub: 内容基于 Andrej Karpathy 的《Intro to

我用夸克网盘给你分享了「AI全套攻略(持续更新中)」

@wangchangfu88 😁😁😁

在 X 看原帖 ↗

当前缺乏对自主编程工具生产力影响的可靠实证研究

AI研究工程
4.3万4770586

据我所知,我们目前尚无任何良好的测试来评估自2025年12月起陆续出现的自主编程工具对生产力的实际影响。所有已发表的论文均出自Claude Code/Codex革命之前。我们在理解当前编程领域正在发生什么这件事上,存在巨大知识空白。

最接近的相关研究是METR于2026年2月发布的非常初步的更新,但其数据质量不足以支撑任何实质性结论。这显然是一个极高风险、高重要性的问题,而我们却掌握极少实证数据(只有大量推测性的Substack文章)。

@PingPlusAI 哦,这提示词简直糟糕透顶

@Ferbin08 我讨厌你的提示词

在 X 看原帖 ↗

LLM记忆越强,越难模拟真实用户行为

AI认知科学人机交互
1.4万31188110

新研究指出,当前LLM记忆能力过强导致其作为用户模拟器(如模拟学生)失真,需引入类人遗忘机制。

阅读全文 →

LiteParse v2发布:号称全球最快且最准确的开源无模型PDF解析器

AI开源工程
11.2万911.1K1.2K

我们创建了全球最快的PDF解析器⚡️。它比当前所有其他开源、无模型(model-free)PDF解析器更准确,包括pymupdf、pypdf、markitdown、pdftotext、opendataloader和pymupdf4llm。

推出LiteParse v2——我们已将整个库用Rust语言重写。项目链接:

该工具完全开源且免费。

@davielam_ 您这里是否有示例文档?我们将用于迭代优化核心功能。

在 X 看原帖 ↗

10句提示词可显著提升Claude、ChatGPT和Gemini输出质量

AI工程研究
1.7万1365121

原文列举10个具体提示短语,每句对应一种认知操作(如反向思考、质疑假设、指出盲点),均直接作用于AI响应的深度、严谨性与创造性。

阅读全文 →

提示工程与普通提示有本质区别

AI工程科普
2.1K4653

AI 系列 - 第 04 期:提示工程到底是什么?如果你曾好奇成为提示工程师意味着什么,以及设计一个提示需要哪些能力,其核心归结为一点:提示工程与普通提示存在真实差异。

两者是截然不同的实践。链接指向相关说明(

@ChemistDeFi 回复称‘那样会更好,我同意’,并补充‘但我真心不想承受那种压力’。

@OnyiEth 回复‘感谢你,Onyi’。

在 X 看原帖 ↗

开发者完成Meridian Agent后沉迷编码,顺手构建天气代理仪表板

AI开源工程
1.9K35613

完成@meridian_agent开发后,作者表示自己已陷入‘编码氛围感’成瘾状态,并同步完成了天气代理(weather agent)的仪表板构建。

作者特别致谢@0xyunss(昵称bubub),因其提供了为期一年的免费大语言模型(LLM)服务,称该资源价值等同于20美元的Claude Sonnet订阅;该资源被用于构建Opus工作流,并生成结构化文档struktur.md,其余代码编写使用Claude Code。

文中附有两个链接:一是Meridian Agent与@0xyunss关联的Meridian仪表板(

多条回复中,多位用户(@ali111sama、@fachriceg、@BigBossXCV、@ahtjong888、@noela_zee、@brother_jam35)向@meridian_agent和@0xyunss表达感谢;@eindrasap评论称‘效果很丑’;@kiippllii提及‘Polymarket与天气相关’。

在 X 看原帖 ↗

Xiaomi Mimo AI订阅界面模型名大小写不一致致Claude配置失败

AI产品体验工程
1.5万35417

吐槽下Xiaomi Mimo AI的订阅管理界面,我按照你写的参数设置,最后Claude显示是参数错误。

我再打开你的Claude设置,才发现你订阅界面写的模型是MiMo-V2.5-Pro,但Claude设置必须设置为mimo-v2.5-pro才行。

咋产品经理自己不走一圈就发布网页?

@xmaxxie1119 是,只要他们产品经理哪怕用一下自己的模型,也会发现问题。

在 X 看原帖 ↗

用ChatGPT-Image2生成4张内衣详情页氛围图

电商AI图像生成营销
1.1万148452

💗用ChatGPT-Image2扩展《内衣电详情页》,深酒红黑蕾丝款氛围图! 用4张成交氛围图提升详情页转化率✈️

1、深酒红蕾丝+透肤丝袜穿搭
2、蕾丝花纹&玫瑰金细节特写
3、背部肩带与流畅腰线
4、成套产品精致平铺

电商图不只是讲功能,更要把让用户心动、想买的氛围感做足!

提示词在评论区👇

《内衣详情页氛围图》提示词: 【统一要求】

⚠️ 必须输出合法 JSON,不要加注释或 markdown 标记。

在 X 看原帖 ↗

AI写真提示词关键在多维控制而非关键词堆砌

AI图像生成提示工程
4.1K25442

兄弟们,刚用这个GPT Image 2的写真助手模板,测试了一组「夜色情绪 × 高级可爱风卧室」提示词。效果依然很能打😆

这类提示词的关键,不是写“性感”两个字,而是控制好:
- 氛围感
- 服装材质
- 人物姿态
- 光线情绪
- 身体线条
- 镜头距离

当这些元素统一起来,画面才会有真实写真感,而不是廉价摆拍感。

AI 写真提示词真正难的地方,往往不是堆关键词,而是让风格、人物、姿态、服装、光线与构图协调一致。

@duange6099 那就不是写真了,写真本来就比较假

在 X 看原帖 ↗

ESMFold2发布:开源蛋白结构与互作预测引擎

AI生物计算开源
24.3万3311.2K532

ESM团队推出开源科学模型ESMFold2,支持蛋白结构预测、设计及相互作用建模,尤其在抗体靶向识别上达SOTA。

阅读全文 →

开源AI学习工具:输入主题自动生成完整课程

AI开源教育
38.7万2113099

我开发了一款开源工具,用 AI 辅助学习任何内容:
- 输入你想学的东西
- 它会为你生成一门完整课程

你可以从零基础起步,逐步掌握任意学科,哪怕是量子物理这类复杂主题。
它提供三种学习格式:
- 解释(Explanation):短小精悍的课时

免费试用地址:
如果你喜欢它并希望订阅,可使用优惠码 X30,永久享受 7 折优惠(不仅首月,而是终身),该优惠码于 6 月 30 日过期。

你也可以在本地运行它,或自行托管(MIT 许可证,可随意使用)。详情见:

它采用如下技术栈:
- @nextjs
- @better_auth
- @shadcn
- @tailwindcss
- @aisdk
- @workflowsdk
- Postgres 配合 @prisma ORM

大部分任务……

在 X 看原帖 ↗

Cognition融资超10亿美元,估值260亿美元

AI商业工程
56.4万1782.1K383

AI软件工程公司Cognition宣布完成超10亿美元融资,估值达260亿美元。

阅读全文 →

SAERL用稀疏自编码器激活指导大模型训练数据工程

AI可解释性强化学习
7.8K16131116

新方法SAERL从LLM内部激活中直接提取多样性、难度和质量信号,替代昂贵的外部评估,在数学推理RL任务中提升准确率3%、加速训练20%。

阅读全文 →

AI未必加剧权力集中与威权主义的四个理由

AI政治影响开源
4.0万1711553

以下是我不确信AI将加剧权力集中并助长威权主义的四个理由,尽管这种可能性确实存在。(1)AI具有竞争性和分散性。开源模型正展现出高度能力。这意味着没有单一模型能决定我们能做什么或不能做什么,因为我们拥有多种替代方案。

(2)多位评论者指出,算力、能源和数据中心可能构成新的集中化瓶颈,但目前尚无证据表明这些要素已形成不可逾越的壁垒或单一控制点。

(3)有研究评估了大模型对威权主义指令的响应,结果显示现有模型在相关测试中表现不足,但该评估本身被作者明确认定为“严重不充分”,无法支撑确定性结论。

(4)历史经验显示,技术影响并非单向:例如阿拉伯之春期间对社交媒体的乐观预期事后被证明过于高涨,说明技术与政治结果之间不存在简单因果关系。

在 X 看原帖 ↗

用户称因推广Clanker Cloud遭LinkedIn永久限制

社交平台账号限制Clanker Cloud
1.1K2651

用户@tekbog在𝕏(原Twitter)发帖称,其账号因推广Clanker Cloud而被LinkedIn施加永久‘underclass’限制。

该用户强调,自己并未使用任何自动化工具操作LinkedIn,仅进行常规点击和新开浏览器标签页等人工操作。

帖文附有一条短链接(

另一用户@d3layd在回复中表示,目前甚至无法登录LinkedIn账户。

在 X 看原帖 ↗

Hermes Kanban上线:将Hermes智能体工作流可视化

AI工程工具
3.9K57662

你是否曾希望能在Hermes智能体上查看并配置一套规范的可视化工作流?Hermes Kanban将智能体工作流变为真正可‘看见’的形式——把宏大目标转化为清晰、可执行的具体任务,并支持为每项任务指派合适的智能体或领域专家。

链接指向功能落地页:

用户@iMichaelTen评论:“非常好的想法!我之前让Hermes为我构建了一个,但每次更新都得重新创建一个。”

用户@tonysimons_评论:“不错!很高兴你正在充分利用它。”

用户@AURELIANbuilds评论:“冲啊!听起来你已经完全掌握了。”

用户@israfill评论:“太美了。”

用户@carlosprada0x评论:“很喜欢这个视觉设计!”

用户@moikapy评论:“非常棒。”

在 X 看原帖 ↗

用好Coding Agent的关键在需求分析与规划阶段

AI工程研究
3.0万55288295

用好 Coding Agent,重点是两头,尤其是开头的部分,如果一开始就走偏了后面怎么改都改不好。 比如我要开发一个新功能,首先不是直接叫给 Agent 去写,会把需求简单整理一下,发给三个不同的 Agent(Codex、Claude Code、Cursor),打开 Plan 模式去帮我写 Plan,这里要用最好的模型。

@duange6099 不一定

@aceeveryserve 是,除了发散视野,还有隔离上下文也很有价值。 最终交付还是得收束

在 X 看原帖 ↗

Codex+GPT-5.5实战课上线:2小时手把手教学

AI工程教程
5.3K247668

Codex 最强实战课重磅上线,建议直接收藏。 短短不到2小时,就能带你吃透 Codex + GPT-5.5 这套超强“AI开发外挂”: 从技能与插件基础配置、自动化工作流完整搭建,到多任务并行实操,全程一步一步手把手演示。 想快速掌握高效实用的 Vibe Coding 技巧,这条免费中文实战教程,绝对是当下最值得刷的。

@hisevenih 感谢支持

在 X 看原帖 ↗

小米MiMo v2.5模型以高性价比引发关注

AI开源工程
1.9万1116345

哇。看起来 @XiaomiMiMo v2.5 模型的性价比简直惊人 :O(每个回答后都标出了该次 prompt 的价格。上下文包含超 40k 条工具描述、系统提示、技能等。)

缓存效果也很惊艳……

在 X 看原帖 ↗

Claude Design 与Claude AI/Code共享使用额度

AI产品设计工程
2.5万12129102

Claude Design 现在和 Claude AI 网站以及 Claude Code 共享额度了,之前是独立的额度,一不小心就没了。 这个产品推荐多用用,产品设计能力和 UI 设计能力挺不错的。 一个经验就是你先让它帮你定义一套设计系统(Design System),打磨好了后,基于设计系统去设计 UI,一致性会好很多

@agmugei 你看我截图顶部,以及你去看一下 Claude AI 的usage

@lxfater 搜索 Design System,资料很多很多

在 X 看原帖 ↗

港大开源AI视频生成工具ViMax,一键生成带货视频

AI开源工程
7.3K2095116

港大最新开源的 AI 视频神器 ViMax 真的太牛了! 不管是跨境电商 带货视频 还是AI短剧自动生成,它都能完美搞定! 今天给大家实测的是带货视频的生成~ 输入一句话商品描述,它就能自动走完全流程: 自动写爆款带货脚本 自动生成专业宫格分镜提示词 自动分镜 + 多镜头切换

@0X_4444 嗯嗯 电商带货那些很火的

@hyyuan99 可以试试哈~

@eastweb3eth 是的 尼卡 可以试试哈

@charles48011843 嗯嗯 对的 charles老师

@panExorcist 谢谢哈 我是做成了网站哈~

@0xLin88 嗯嗯 对的

@spicycandy00 哈哈 可以的 糖宝~

@xx03199 厉害哦 这猴子头像不错 哈哈

@YuGuan1209 嗯嗯 是的 鱼人老师

@Supers6061 哈哈 下次可以开搞跨境电商了

@Michell49473040 seed

在 X 看原帖 ↗

Blackgirlbytes重启Twitter Spaces聚焦真实AI工作流

AI工程社区
3.1K205815

嘿各位!我重新启动 Twitter Spaces 啦~哈哈。
这个系列将聚焦于「来自可信开发者的真正 AI 工作流」。

首位嘉宾:独一无二的 Angie Jones(@techgirl1908)!
她将分享:
✅ 她如何在面试中考察 AI 技能
✅ 她个人的 AI 工作流
✅ 跨组织推进 AI 的实用建议

时间:6 月 5 日,太平洋时间中午 12 点 / 东部时间下午 3 点

@ChaiWithJai 哈哈哈同感。X 是啥?😂

@LawrenceDCodes @techgirl1908 到时候见!

@HenriHelvetica @techgirl1908 这正是大家需要的!!

@Ace_KYD @techgirl1908 耶!超期待在现场见到你

@ConorBronsdon @techgirl1908 耶!我也是!

在 X 看原帖 ↗

AI代理需用Proton Pass保障安全

安全AI工具
2.0万12165190

任何运行 AI 代理却未使用 Proton Pass 来管理代理的人,等于主动邀请黑客攻击。我们的工作流是:Mr. @Grok → 类似 And OpenClaw 的系统 → Proton Pass。全程受控且安全。

@vnovak_404 @grok Vikror,这只是我对自用产品的推荐。我与该公司无任何合同关系,也不认识该公司任何人。

在 X 看原帖 ↗

AI Agent完成上市公司首次覆盖报告文字部分

AI金融自动化
1.0万45836

今天,用户@yuyy614893671让其AI Agent撰写某上市公司的首次覆盖报告,称文字部分“太清晰、太有条理”。

该Agent在文字表达上展现出较强结构化能力,但图表制作和财务模型建模水平仍需提升,用户需人工检查。

报告包含估值部分,涉及不同折现率的选择——过去需耗费较长时间思考,而AI已能快速生成形式完备的估值框架。

AI还生成了敏感性分析表,基于增长假设与权益折现率构建模型。

@golden_pan1评论指出:撰写形式规范的报告已不再稀缺;核心竞争力转向判断力,以及对盈利驱动因素或风险因子的快速识别。

@LeeFisun补充说明:该Agent基座为Gemini,但需接入用户自有数据库、skills,并通过claw等工具进行复杂配置。

在 X 看原帖 ↗

教程:5步接入OpenRouter的23个大模型

教程AI开源
1.4万44016

扒皮哥第三弹介绍如何接入OpenRouter平台提供的23个大模型。整个过程共5步。

第一步:访问 注册一个OpenRouter账号。

第二步:登录后点击右上角头像,进入 Profile 页面,再选择 API keys 选项。

第三步:在 API keys 页面创建一个新的 API key。至此,OpenRouter端配置完成。

第四步:打开已安装的 Hermes Web UI,点击“模型”选项,再点击“添加模型”,填入模型配置链接

第五步未在原文中明确写出,但根据上下文逻辑,应为完成配置后即可在Hermes中调用OpenRouter所支持的23个大模型。

用户 @libapi_ 表示体验顺畅。用户 @btc_juanmao 请求协助学习相关脚本。

在 X 看原帖 ↗

Brad Mills 开发 Hermes 智能体基础技能集

AI工程开源
4.1K25572

今天,Brad Mills 为其新部署的 Hermes 智能体构建了一套基础技能熟练度体系。

Tidy 表示工作区卫生能力,即保持环境无冗余、无混乱;
Methodical 表示为智能体编写操作手册(playbook)与标准作业程序(SOP)的能力;
Helpful 表示为人编写操作手册与标准作业程序的能力;
Thorough 表示将上述成果发布至 GitHub 的能力,对应仓库链接为

Brad Mills 在推文中邀请 @rot13maxi 让其智能体审阅该技能集。
他还抄送 @Teknium,提问:是否应将此类基础技能集(‘101’级)作为智能体出厂默认配置?

在 X 看原帖 ↗

Gemini Omni视频生成提示词5大实用技巧

AI工程商业
8.6K154585

Google推出Gemini Omni实现文生视频,但需掌握文化符号调用、文字特效控制、镜头指令、局部修改等提示词方法。

阅读全文 →

Steve Lauda 探索品牌方向微调的早期对齐

品牌战略社交媒体
1.6K24711

早期探索,旨在尽早就品牌方向的微调达成一致。

@PickleNik0864 是的,长官!

在 X 看原帖 ↗

推特用户调侃称学会某技能后Claude和GPT将调用人类

AI社交媒体幽默
11.3万311.7K47

推文写道:‘都学会的话claude和gpt都得直接调用你了’,并附带一个短链接

该推文未解释‘都学会’指代何种知识、技能或工具,未描述调用机制、技术原理或实现路径,也未提供任何截图、代码、文档或第三方验证信息。

推文末尾提及两个账号:@ColorfulToilet(昵称‘马桶爹’)和@ninthbit_ai,并附有‘哈哈哈哈哈哈’表情化回应,整体语境为网络玩笑,无实质技术陈述或事实主张。

在 X 看原帖 ↗

📖 深度解读

精选文章的中文编辑重写 · 按更新时间排列

查看全部深度解读 →
▲ Top

📬 订阅 AI Pulse

每天三次更新,不错过重要信号

▲ 回到顶部