NotionNext BLOG

𝘀𝘀𝗶.𝘵𝘦𝘢𝘮

𝑆𝑡𝑎𝑟𝑡𝑢𝑝𝑠.𝐹𝑢𝑛𝑑

𝗘𝙄.𝖡𝗈𝗍

AI提示词收藏

📝 Rust系统工程师助手提示词

📝 文生图提示词扩写系统提示词

📝 Gemini Diffusion 系统提示词

📝 DeepSeek“越狱”提示词

📝 Claude Code 系统提示词

📝 OpenAI Deep-Research 系统提示词

📝 Gemini 2.0 Flash Thinking 系统提示词

📝 Grok-3 联网版系统提示词

📝 豆包系统提示词

📝 KIMI 系统提示词

📝 智谱 ChatGLM 系统提示词

📝 Cursor 智能体系统提示词

📝 Manus 完整版系统提示词

📝 Gemini2.5 系统提示词

📝 Claude3.7 系统提示词

📝 ChatGPT-4o 系统提示词

📝 微软VSCode Agent系统提示词

📝 NotebookLM问答功能的系统提示词

📝 AI原生浏览器Dia最全系统提示词

📝 Perplexity Deep Research 系统提示词

📝 即梦AI 擦玻璃提示词

📝 Grok 系统提示词：Chat、DeepSearch、Explain、X摘要器

📝 谷歌设计神器 "Stitch"系统提示词

📝 Claude4 系统提示词 250522

📝 Windsurf系统提示词

📝 OpenAI-Codex系统提示词

经典论文解读

📚 大模型推理效率飙升3倍！协作式思维链技术揭秘

📚 扩散模型新突破！DiffStateGrad：逆问题求解的鲁棒性利器

📚 联邦学习如何助力AI产品环保？揭秘减少35%碳排放的奥秘

📚 视觉空间推理新突破：GRPO训练法让中小模型超越GPT-4o

📚 混沌系统与反事实推理的挑战：当科学遇上复杂性

📚 AI老师革命：仅需10%人工标注，高效作文评分不是梦

📚 BounTCHA：AI时代下的人类网络安全守护者

📚 OmniHuman-1：重新定义人体动画模型的规模化训练

📚 AI如何成为蜜蜂的守护者？最新研究揭示农药毒性预测新突破

📚 MolGround：首个分子“指哪打哪”评测基准，让AI读懂化学结构的语言

📚 VET触觉系统：开启人机交互新纪元，触感反馈也能“看得见摸得着”

📚 TathyaNyaya与FactLegalLlama：推动印度法律背景下的实际判决预测与解释

📚 SCAM：评估多模态基础模型对真实世界排版攻击的鲁棒性

开源仓库推荐

💻 2624道DevOps和SRE面试题，助你高效备战技术面试！

💻 NetExec：网络执行工具，提升你的网络安全测试效率

💻 Stable Diffusion web UI：一键安装，开启你的AI绘画之旅

💻 用Vanna AI轻松生成SQL查询，提升数据分析效率！

💻 用AI动态模型和语音克隆技术，将电子书转换为带章节和元数据的有声书，支持1107+种语言！

💻 探索AI对冲基金：教育项目中的智能交易决策

💻 vLLM：让大型语言模型推理和服务更高效、更经济

💻 Cursor Free VIP：解锁Pro功能的终极指南

💻 探索IntentKit：打造你的AI智能助手，开启高效未来

💻 CUDA Python：性能与生产力的完美结合

💻 InstructLab Core：用自定义分类数据训练模型的终极指南

💻 FunASR：你的语音识别神器，让工作更高效！

💻 Open edX平台：全球教育网站的强大引擎

💻 Datadog集成核心：提升监控效率的利器

💻 LightRAG：简单快速的检索增强生成工具

💻 Material for MkDocs：让你的文档工作简单高效

💻 🚀LangBot：你的多平台大模型即时通信机器人助手

💻 抖音批量下载神器，去水印免费下载视频、图集、合集、音乐！

💻 LangGraph：构建可控AI代理的低级编排框架

💻 MarkItDown：一键将文件转换为Markdown的神器

💻 探索Wagtail：一个专注于灵活性和用户体验的Django内容管理系统

📚MolGround：首个分子“指哪打哪”评测基准，让AI读懂化学结构的语言

type

status

slug

summary

tags

category

icon

password

Date

MolGround：首个分子“指哪打哪”评测基准，让AI读懂化学结构的语言

在化学与AI的交叉领域，一个长期被忽视的问题浮出水面：现有的分子理解模型大多停留在“整体描述”层面，而无法像人类化学家那样精准定位分子中的关键结构。来自香港理工大学和四川大学的团队提出全新评测基准MolGround，首次将“分子接地”（Molecular Grounding）概念引入AI for Science，让模型学会在分子结构上“指哪打哪”。

一、化学家的火眼金睛：从整体描述到精准定位

传统分子理解任务（如性质预测、分子生成）如同给化合物拍摄证件照，只能呈现整体特征。而真正的化学分析需要像法医鉴证般精准——当提到“乙酰氨基酚的毒性来源于苯环上的羟基”，模型必须准确圈出对应的原子位置。

notion image

图1：分子接地的五个核心任务示意图

MolGround定义了五大接地任务：

化学命名实体识别（CNER）：从文本中提取"苯环""羧酸基"等专业术语

双向名称-结构映射（BNSM）：实现IUPAC名称与SMILES编码的互译

参考子结构定位（RSL）：在分子图中标出特定功能基团

子结构关系建模（SRG）：分析不同基团间的相互作用

子结构频率统计（SFA）：统计特定结构在分子中的出现次数

二、79万问答对构建分子理解新标尺

研究团队采用螺旋式开发模式，构建了迄今最大的分子QA数据集：

数据来源：整合ChEBI-20、LPM-24等经典数据集，补充最新化学文献

规模突破：55,989个分子覆盖1-574个原子规模，最终形成79,000组问答对

智能标注：基于多智能体系统（元检索器+文本解释器+结构解析器）实现自动化标注，人工专家负责质量把控

notion image

图2：分子命名多样性与结构映射挑战

三、AI化学家的进化之路：实验结果揭示突破

在GPT-4o、LLaMA 3.1等12个主流模型的横向评测中，传统方法遭遇严峻挑战：

任务	最佳模型	准确率	核心难点
CNER	GPT-4o	63.3%	区分"醚键"与"酯键"等近义词
RSL（单结构）	多智能体系统	75.5%	旋转异构体的识别
SFA	Mol-Instructions	31.7%	多环结构的重叠计数

notion image

图3：噻吩环的旋转异构体识别挑战

研究团队开发的多智能体原型系统展现显著优势：

三大组件协同：元检索器调用PubChem数据库，文本解释器解析语义，结构解析器通过RDKit进行子图匹配

超越GPT-4o：在RSL任务中IoU指标提升42%，错误定位减少68%

零样本学习突破：引入检索增强生成（RAG）技术后，SFA任务准确率跃升489%

四、从实验室到药厂：接地技术赋能药物研发

接地技术的价值不仅在于评测，更体现在实际应用中的链式反应：

案例1：分子描述生成

传统方法BLEU-4得分：0.327

加入接地信息后：0.419（提升28%）

生成描述示例：

"双氯芬酸钠（SMILES：O=C(O)Cc1ccccc1Cl）的镇痛作用主要源于苯环（原子1-6）与羧酸基（原子7-9）的协同作用"

案例2：ATC药物分类

基准模型准确率：71.4%

融合子结构特征后：75.7%（提升4.3个百分点）

关键发现：含"β-内酰胺环"的分子在抗菌类目预测准确率达92%

notion image

图4：接地技术提升药物分类可视化

五、化学AI的新纪元：挑战与机遇并存

尽管取得突破，分子接地仍面临三大挑战：

命名歧义：同一结构可能有12种IUPAC命名变体

结构相似性：硒吩环与噻吩环仅差一个原子，但化学性质迥异

动态关系：功能基团的相互作用随分子环境变化

未来方向：

构建万亿级3D分子预训练模型

开发可解释性可视化工具

与自动化实验平台深度整合

这项发表于arXiv的研究，不仅为AI化学家装上了“结构显微镜”，更预示着药物发现、材料设计等领域将迎来精准化变革。当机器学习模型真正读懂化学家的"行话"，我们距离"烧杯里的AlphaGo"又近了一步。

（文中所有实验数据及图表均来自论文原文，保留原始图片URL及顺序）

https://arxiv.org/abs/2503.23668

AI如何成为蜜蜂的守护者？最新研究揭示农药毒性预测新突破 VET触觉系统：开启人机交互新纪元，触感反馈也能“看得见摸得着”

AI提示词收藏

📝 Rust系统工程师助手提示词

📝 文生图提示词扩写系统提示词

📝 Gemini Diffusion 系统提示词

📝 DeepSeek“越狱”提示词

📝 Claude Code 系统提示词

📝 OpenAI Deep-Research 系统提示词

📝 Gemini 2.0 Flash Thinking 系统提示词

📝 Grok-3 联网版系统提示词

📝 豆包系统提示词

📝 KIMI 系统提示词

📝 智谱 ChatGLM 系统提示词

📝 Cursor 智能体系统提示词

📝 Manus 完整版系统提示词

📝 Gemini2.5 系统提示词

📝 Claude3.7 系统提示词

📝 ChatGPT-4o 系统提示词

📝 微软VSCode Agent系统提示词

📝 NotebookLM问答功能的系统提示词

📝 AI原生浏览器Dia最全系统提示词

📝 Perplexity Deep Research 系统提示词

📝 即梦AI 擦玻璃提示词

📝 Grok 系统提示词：Chat、DeepSearch、Explain、X摘要器

📝 谷歌设计神器 "Stitch"系统提示词

📝 Claude4 系统提示词 250522

📝 Windsurf系统提示词

📝 OpenAI-Codex系统提示词

经典论文解读

📚 大模型推理效率飙升3倍！协作式思维链技术揭秘

📚 扩散模型新突破！DiffStateGrad：逆问题求解的鲁棒性利器

📚 联邦学习如何助力AI产品环保？揭秘减少35%碳排放的奥秘

📚 视觉空间推理新突破：GRPO训练法让中小模型超越GPT-4o

📚 混沌系统与反事实推理的挑战：当科学遇上复杂性

📚 AI老师革命：仅需10%人工标注，高效作文评分不是梦

📚 BounTCHA：AI时代下的人类网络安全守护者

📚 OmniHuman-1：重新定义人体动画模型的规模化训练

📚 AI如何成为蜜蜂的守护者？最新研究揭示农药毒性预测新突破

📚 MolGround：首个分子“指哪打哪”评测基准，让AI读懂化学结构的语言

📚 VET触觉系统：开启人机交互新纪元，触感反馈也能“看得见摸得着”

📚 TathyaNyaya与FactLegalLlama：推动印度法律背景下的实际判决预测与解释

📚 SCAM：评估多模态基础模型对真实世界排版攻击的鲁棒性

开源仓库推荐

💻 2624道DevOps和SRE面试题，助你高效备战技术面试！

💻 NetExec：网络执行工具，提升你的网络安全测试效率

💻 Stable Diffusion web UI：一键安装，开启你的AI绘画之旅

💻 用Vanna AI轻松生成SQL查询，提升数据分析效率！

💻 用AI动态模型和语音克隆技术，将电子书转换为带章节和元数据的有声书，支持1107+种语言！

💻 探索AI对冲基金：教育项目中的智能交易决策

💻 vLLM：让大型语言模型推理和服务更高效、更经济

💻 Cursor Free VIP：解锁Pro功能的终极指南

💻 探索IntentKit：打造你的AI智能助手，开启高效未来

💻 CUDA Python：性能与生产力的完美结合

💻 InstructLab Core：用自定义分类数据训练模型的终极指南

💻 FunASR：你的语音识别神器，让工作更高效！

💻 Open edX平台：全球教育网站的强大引擎

💻 Datadog集成核心：提升监控效率的利器

💻 LightRAG：简单快速的检索增强生成工具

💻 Material for MkDocs：让你的文档工作简单高效

💻 🚀LangBot：你的多平台大模型即时通信机器人助手

💻 抖音批量下载神器，去水印免费下载视频、图集、合集、音乐！

💻 LangGraph：构建可控AI代理的低级编排框架

💻 MarkItDown：一键将文件转换为Markdown的神器

💻 探索Wagtail：一个专注于灵活性和用户体验的Django内容管理系统