当前位置:首页 > 科技资讯 > 广东科技

东莞发布“材料界DeepSeek”

时间 : 2025-02-18 08:58:57 来源 : 南方日报 【字体: 【打印】

松山湖材料实验室的自动化平台。


   编者按:

  当“世界工厂”遇上人工智能,当传统车间走向数据云端,有“隐形冠军”续写传奇,也有新锐力量重塑产业,还有中小企业在全球市场中突围。以它们为窗口,我们观察东莞企业如何以创新为刃,开辟产业升级的新路径。

  即日起,南方日报、南方+推出《莞企新势》栏目。栏目将讲述莞企之间的新鲜事,关注莞企发展的新趋势,敬请垂注。

  近期,通用大语言模型DeepSeek的横空出世,标志着人类在人工智能领域前进一大步。未来,智能助手和自动化工具将深刻改变人们的生活和工作方式。

  得益于通用AI模型的蓬勃发展,近日,松山湖材料实验室发布了一件材料科学领域的重磅AI工具:MatChat AI智能体。它是一款专注于材料科学领域的智能问答引擎,基于大语言模型(LLM)与增强搜索技术(RAG),提取了超过28万篇专业论文构建知识库。

  这款被称为“材料科学界的DeepSeek”的AI平台,凭借其专业性和精准性迅速引发行业关注。观察人士认为,MatChat的发布不仅是技术突破,更标志着垂类科学研发范式的转变——从经验驱动转向“数据+AI驱动”。

  当AI能够将海量文献转化为可操作的知识,并链接实验与产业时,垂类科学的创新速度将不再受限于人类个体的认知边界。对于东莞这座“制造业名城”而言,MatChat或是其从制造跃向“智造”的关键拼图。

  撰文:南方日报记者 唐卓

  策划:戴双城

  从“幻觉回答”到精准溯源

  随着DeepSeek的爆火,不少网友发现,当使用R1模式时,大模型总是在“一本正经地胡说八道”。这并非错觉,在Vectara HHEM人工智能幻觉测试中,DeepSeek—R1显示出14.3%的幻觉率。

  何谓“幻觉”?幻觉的本质是补白,是脑补。通俗来说,就是AI“胡编乱造”的信息,即AI在回答用户问题时,对于不知道正确答案的问题,不是明确告知用户“我不知道”,而是根据已有的知识编出一个听起来像是对的答案,但实际上是假的、错误的,甚至完全不存在的信息。

  对于普通咨询而言,这种脑补无伤大雅,甚至还饶有趣味。但对于科学研究来说,“幻觉”是最大的敌人。中国科学院物理研究所研究员、博士生导师刘淼直言:“科学领域需要的是真实、可验证的知识,而非想象力。”

  正如刘淼所言,MatChat AI基于大语言模型(LLM)与增强搜索技术(RAG),从28万篇材料科学、物理、化学论文中提取知识,构建了一个垂直领域的知识库。用户通过对话即可获取高度结构化的学术信息,并附有参考文献和原文链接,彻底解决了通用模型中常见的“虚构答案”问题。

  例如,当用户询问“钙钛矿光伏材料的产业应用”时,MatChat不仅能总结关键信息,还能精准定位到相关论文的段落与图表,甚至预测合成路径。

  这种“精准溯源”能力,让MatChat迅速吸引了4700多名用户,上线一周即完成27万次问答,成为科研工作者的智能文献助手。未来,松山湖材料实验室将把Atomly材料科学数据库平台、“机器人科学家”与MatChat结合起来,掀起一场垂类科学领域“AI+材料”的范式革命。

  厚积薄发的“奇袭”

  100多年前,当泰坦尼克号航行在大西洋海面上时,出现在船员望远镜中的仅是冰山的一角。而船员们看不见的,是冰山之下规模庞大的隐藏部分。

  MatChat的发布看似是一次技术“奇袭”,但其根基却深埋在松山湖实验室多年的数据积累中。

  早在MatChat诞生前,材料实验室已建成全球领先的材料数据库Atomly.net,收录了35万种材料的晶体结构、热力学稳定性等计算数据。值得一提的是,这些数据通过密度泛函理论等物理模型生成,精度接近实验验证结果,可以直接作用于企业新材料的研发。

  刘淼如此描述这一技术迭代:“我们相当于用算力换数据,再用数据训练AI模型——这是左脚与右脚的交替前进。”

  刘淼还介绍,MatChat的研发并非孤立项目,而是材料实验室“AI+材料”生态的一部分。在人员配备方面,松山湖材料实验室整合了中国科学院多个院所的力量,形成了跨学科的技术网络;在平台建设方面,材料实验室把Atomly材料科学数据库平台、“机器人科学家”与MatChat结合起来,实现从数据预测到实验验证的闭环。

  值得一提的是,“冰山下的支撑”既包含技术生态的构建,也暗含城市资源与制度创新的深层互动。

  一方面,东莞的制造业基础为材料实验室提供了试验场。2023年,实验室四大公共技术平台服务企业超400家,创新样板工厂孵化企业35家,其中靶材、新能源等项目已落地本地产业链,为源头创新提供大量生动热辣的“材料命题”。

  另一方面,东莞积极探索科技体制改革,鼓励松山湖材料实验室将科技成果转化收益的80%分配给科学家团队,这种“风险共担、收益共享”的模式,让无数优秀科技人才鱼跃进莞,刘淼介绍,MatChat项目中的代码构建人员正是来自一线城市的知名“大厂”。

  不难发现,“技术+城市”的双重禀赋,正在重构垂类科学创新范式。从单点突破转向系统能力竞争,而东莞有望成为中国版“橡树岭”的候选者。

  从“两张皮”到产业闭环

  在访谈中,刘淼描述了传统的材料研发模式:假如有一名研发人员在研究一种新型材料,他需要3—5个月时间来检索了解文献;然后再验证这些材料中哪种最稳定,进一步缩小研究范围;最后进入打样环节,通过反复测试样本后,最终得到配适的材料。

  在这一过程中,研发人员需耗费数月阅读文献、设计实验,而企业则苦于无法快速获取可信的科学支持。实验室和产线之间,似乎总横亘着一条难以跨越的天堑,这便是人们常说的科技与产业“两张皮”的问题。

  而MatChat的终极目标,是致力于解决科研与产业脱节的“两张皮”问题。

  如何解决?首先是AI带来的“知识平权”。企业研发人员可直接用自然语言提问,例如“磷酸铁锂电池的优化方向”,AI系统将快速提供文献综述与数据支撑,降低专业门槛。

  其次,材料实验室将数据库、MatChat与“机器人科学家”整合为“材料CRO(合同研发组织)”模式。用户可在线提交需求,由机器人完成合成与测试,形成“数据—模拟—实验”的工业化流程。这一流程带来的直接影响是,企业不再受限于自有研发能力,而可以与科研院所、新型研发机构“无缝衔接”,资源共享,从而提升其源头创新能力。

  由于新的理论、方法、技术或观念的出现,导致原有的研究范式或实践模式发生根本性变革的过程,被称为“范式革命”。当通用大语言模型打响第一枪后,众多以其为“养料”的垂类大模型将层出不穷,深度改变人们的生产和生活方式。在材料领域,“AI驱动的研发”模式正成为新能源、半导体行业的效率引擎,未来,我们或将进入一个“高速创新”的时代。