0

理论网

2024.09.26 | 念乡人 | 34次围观
理论网
  近年来,大模型技术飞速发展,极大提升了全球人工智能技术发展和应用迭代速度,被认为是“迈向通用人工智能的里程碑技术”。面对新一轮大模型引领的人工智能变革,加快推进大模型赋能数智化应用健康发展具有重要意义。   作为最成功的一类大模型,大语言模型是一种包含大规模参数、使用大量文本数据训练出来的深度学习模型,展现了大模型的能力和基本技术框架。目前,这一技术思路和框架已被用来处理图像、视频等多模态数据,并被推广应用于机器人控制与智能决策等场景。各类大模型正处于迅猛发展之中,众多高科技企业纷纷投身大模型建设,围绕大模型已经形成相对成熟的技术框架,但产品和生态尚在发展形成之中。总体而言,大模型的技术发展历程相比以往任何人工智能技术都更迅猛,其影响力也是史无前例的。   大模型的“大”主要体现在3个方面,即模型参数规模大、训练数据规模大和算力消耗需求大。模型参数方面,当前主流大模型的参数规模通常在千亿甚至万亿级别,远远大于以往的各类深度学习模型。训练数据方面,大模型在前期训练阶段和后期调优阶段都需要海量的数据支撑,例如引爆大模型范式的聊天机器人ChatGPT,预训练数据量达到了45TB,其研发公司还在拉丁美洲等地区招募了约1000名员工,专门从事与大模型相关的训练数据标注工作。算力需求方面,根据有关市场调查机构估计,ChatGPT的运行需要上万片最先进的图形处理芯片同时工作,耗电量巨大。   大模型已经展现出惊人的能力,基于大语言模型的聊天机器人是以人机对话为接口的高效信息获取、智能处理和内容生成工具,能够实现高质量的信息整合、翻译和简单的问题求解与规划。其受到全社会广泛关注,主要是它已经初步具备通用人工智能的部分特性,包括通顺的自然语言生成、全领域的知识体系覆盖、跨任务场景的通用处理模型、通畅的人机交互接口。当然,聊天机器人只是大模型的起点,大模型未来的发展趋势也已初见端倪。   第一,大模型有望引领诸多行业的数智化创新发展。大模型的学习模式类似人类大脑,通过学习不同的数据,能够形成多样化的能力,不需要按照任务开发定制化的算法。通过自然的人机交互,智能化地解决复杂问题和实现辅助决策,推动各行业体系变革和生态发展。例如,未来的信息系统可以由领域用户通过与大模型的交互直接搭建和维护,“用户即程序员”,颠覆信息系统研发和应用范式。   第二,领域专用和轻量化大模型是当前技术研究的重点。大模型虽然已经展现出诸多优势,但依然存在可靠性差、训练数据依赖、因果推理能力弱、搭建成本高等短板,在部分领域深度应用上的表现弱于专用小模型。为了更充分地发挥大模型优势,金融、教育、医疗等领域专用大模型已取得了阶段性成果,有望促进各项专业能力的涌现。   第三,大模型有望发展成为更加通用的人工智能。大模型起步于文本信息处理,现已涵盖图片、音视频等多模态数据。在不久的将来,大模型将超越信息域,结合硬件设施,发展成为与物理和人类世界互动的具象智能,逐步缩小与真正的“通用人工智能”的差距。   虽然大模型展现的能力已经让全社会看到了通用人工智能的曙光,但当前大模型也有一定的局限性。一方面,由于大模型自身结构和机制漏洞,有被恶意攻击的风险;另一方面,大模型自身的知识表达和学习模式还存在缺陷,导致其回答中经常出现“幻觉”,如常识性错误、杜撰内容等。   推进大模型赋能数智化应用健康发展,应坚持规划引领、需求带动、应用导向、安全为基,引导、扶持和监督大模型在更广泛的领域应用中长计远虑、扎实落地、稳步推进。   首先,掌握技术主动权,加快自主可控的国产大模型全链条建设。依托我国现有的人工智能人才基础,构建面向大模型与通用人工智能技术的平台和队伍。加大芯片、大数据、人工智能等产业的投入与整合力度,保障“海量数据”“顶尖人才”“算力支撑”的落地,推进我国全阶段自主可控大模型建设,掌握大模型技术发展的主动权和话语权。大力支持国产大模型的下游技术攻关和产品推广,促进国产大模型产品的应用落地和迭代升级。   其次,深化大模型应用生态建设,构建“通用大模型+专用小模型”的成熟应用生态。早在大模型产生之前,基于领域经验归纳和业务知识构建的“小模型”已经广泛应用于各行业。应充分认识并应用好大模型和传统小模型各自的特性,在推广大模型产品的同时进一步推进小模型技术的升级和应用,发挥好小模型轻量级、高效率、善于解决特定问题的优势,逐步推进大小模型融合的应用生态。   最后,建立健全大模型安全审查制度与法律体系,从源头规避大模型发展风险。推动建立行之有效的数据审查机制和接入许可规范,从源头把控大模型内容安全性,并主动参与全球人工智能模型使用规范的标准制定。同时,对于大模型可能产生的风险进行合理评估与审核,如歧视、仇恨言论、私人信息泄露、虚假信息、协助犯罪等。
版权声明

本文系作者授权念乡人发表,未经许可,不得转载。

标签列表