展望2024人工智能四大趋势

2024-01-06 14:33:42   编辑:天下阿道夫
导读根据消息人士的说法,OpenAI正在训练下一代人工智能,暂名Q*(读作Q-star)。OpenAI的下一代产品可能在新的一年发布。数据瓶颈是指高质量数...
根据消息人士的说法,OpenAI正在训练下一代人工智能,暂名“Q*”(读作Q-star)。OpenAI的下一代产品可能在新的一年发布。
 
数据瓶颈是指高质量数据的有限性,可以用来训练AI,合成数据有望打破这个瓶颈。除了对大量高质量数据的需求导致合成数据的追求外,考虑数据安全也是一个重要原因
 
ChatGPT作为世界上性能最强的AI,在计算能力方面遇到了瓶颈。在这种背景下,在人工智能领域讨论量子计算机的应用已经成为一种潜在的未来解决方案。
 
AI代理和无代码软件开发带来了“冲击波”
 
2023年,世界见证了ChatGPT在世界范围内的大火。以生成人工智能为代表的新一代人工智能问世,改变了人工智能(AI)技术和应用的发展轨迹加速了人工智能与AI的互动,是人工智能发展史上的新里程碑。2024年,人工智能技术和应用的发展将呈现哪些趋势?让我们一起展望这些值得关注的主要趋势。
全模拟光电智能计算芯片效果图。经过长期的联合研究,清华大学的研究团队突破了传统芯片的物理瓶颈,创造性地提出了光电融合的全新计算框架,开发了世界上第一个全模拟光电智能计算芯片(ACCEL)。新华社地图
 
趋势一
 
从AI模型向通用人工智能迈向大模型
 
ChatGPT开发者OpenAI在2023年被放置在前所未有的聚光灯下,这也使得GPT-4后续版本的开发达到了风口浪尖。根据消息人士的说法,OpenAI正在训练下一代人工智能,暂名“Q*”(读作Q-star)。OpenAI的下一代产品可能在新的一年发布。
 
根据媒体的爆料,“Q*“可能是人工智能第一次以“从零开始”的方式训练。其特点是智能不来自人类活动的数据,有能力修改自己的代码来适应更复杂的学习任务。前者使人工智能能力的发展越来越不透明,而后者一直被视为人工智能“奇点”诞生的必要条件。在人工智能的发展领域,“奇点”是指机器具有自我迭代的能力,然后在短时间内发展迅速,导致超出人类控制。
 
尽管有些报道说,“Q*“目前,小学难度的数学问题只能解决,距离“奇点”还很远。然而,鉴于人工智能在虚拟环境中的迭代速度可能远远超出想象,它仍然可能在不久的将来独立发展AI,AI可以在各个领域超越人类水平。2023年,OpenAI预测,十年内将出现各方面超越人类水平的人工智能;英伟达创始人黄仁勋表示,通用人工智能可能在五年内超越人类。
 
通用人工智能一旦实现,就可以用来解决各种复杂的科学问题,比如寻找外星人和地外宜居星系、人工核聚变控制、纳米或超导材料筛选、抗癌药物研发等等。这些问题通常需要人类研究人员几十年才能找到新的解决方案,一些前沿领域的研究量已经超过了人力的极限。通用人工智能在自己的虚拟世界里几乎拥有无限的时间和精力,这使得它可能成为人类研究人员在一些容易虚拟化的任务中的替代品。但到时候,人类如何监督这些问题,在智力保障方面会超过它们的水平。
 
当然,我们不应该过分高估硅谷巨头的一些言论,因为在人工智能发展的历史上,我们已经经历了三个“AI寒冬”,其中有很多宏大的技术愿景因为各方面的限制而变成泡沫的例子。但目前可以肯定的是,大模型技术还有很大的提升空间。除了GPT-4,谷歌的“双子座”(Gemini),目前,Anthropic的Claude2是仅次于GPT-4的大型模型,国内百度“文心一言”和阿里“通义千问”,也是国内大型模型中的佼佼者。同样值得期待的是,他们是否会在新的一年里推出更具革命性的产品。
 
趋势二
 
合成数据打破人工智能训练数据瓶颈
 
数据瓶颈是指高质量数据的有限性,可以用来训练AI,合成数据有望打破这个瓶颈。
 
合成数据是机器学习模型在模仿真实数据的基础上,利用数学和统计科学原理合成的数据。关于什么是合成数据,有一个简单易懂的比喻:就像给AI写专门的教材一样。例如,虽然“小明”和“小红”这样的虚构名称可能出现在英语课本的对话中,但并不影响学生对英语的掌握。因此,从某种意义上说,教材可以看作是学生编译、筛选和处理的“合成数据”。
 
有论文显示,“思维链”能力只有在模型规模至少达到620亿参数后才能训练,即循序渐进的逻辑推理。但现实的尴尬是,到目前为止,人类还没有那么多可以重复和训练的高质量数据。利用ChatGPT等生成型人工智能产生高质量的合成数据,未来的AI将获得更高的性能。
 
除了对大量高质量数据的需求导致合成数据受到追捧外,考虑数据安全也是一个重要原因。近年来,各国出台了更严格的数据安全保护法,使得客观上使用人类生成的数据来训练人工智能变得更加繁琐。这些数据不仅可能隐藏个人信息,而且许多数据也受到版权保护。目前互联网隐私和版权保护还没有形成统一的标准和完善的结构,使用互联网数据进行训练很容易导致大量的法律纠纷。如果你考虑对这些数据脱敏,你将面临两种选择和识别的困难。
 
此外,使用人类数据进行训练也可能导致人工智能学习有害内容。一些使用日用品制造炸弹和控制化学品的方法包括许多人工智能不应该出现的坏习惯,如在任务执行过程中偷懒、为了取悦用户而撒谎、产生偏见和歧视等。如果使用合成数据,使人工智能在训练中尽可能减少接触有害内容,有望克服使用人类数据训练时附带的上述缺点。
 
从以上分析可以看出,合成数据可以说是相当开创性的,有望解决人工智能和数据隐私保护之前无法兼得的问题。但与此同时,如何保证相关公司和机构负责任地制作合成数据,如何制作出符合中国文化和价值观的合成数据培训集,在规模和技术水平上堪比以英语网络数据为中心的西方,也将成为中国面临的一个具有挑战性的课题。
 
此外,合成数据带来的一个重大变化是,来自人类社会的大数据可能不再是人工智能培训的必要条件。在未来的数字世界中,人类数据的生成、存储和使用将遵循人类社会的规则和秩序,包括维护国家数据安全、保守商业数据秘密和尊重个人数据隐私,而人工智能培训所需的合成数据将采用另一套标准进行管理。
 
趋势三
 
人工智能可能首先应用于量子计算机。
 
人工智能作为电子计算机发展到今天的前沿应用,一直存在着计算能力不足的问题。在ChatGPT问世数月后,OpenAI总裁奥尔特曼公开表示,他并没有鼓励更多的用户注册OpenAI。OpenAI甚至在2023年11月宣布暂停ChatGPTPlus付费订阅新用户的注册,以确保现有用户拥有高质量的体验。显然,ChatGPT作为全球性能最强的AI,已经遇到了计算能力等瓶颈。在这种背景下,我们将讨论量子计算机在人工智能领域的应用。
 
首先,人工智能领域的算法大多属于并行计算的范畴。例如,在玩围棋的过程中,AlphaGo需要考虑对手在不同位置落后的应对技巧,找到最有可能赢得棋局的方法。这就需要计算机优化并行计算的效率来实现。量子计算机擅长并行计算,因为它可以同时计算和存储“0”和“1”两种状态,不需要像电子计算机那样消耗额外的计算资源,比如串联多个计算单元,或者在时间上并列计算任务。计算任务越复杂,量子就越复杂。
 
其次,运行ChatGPT所需的硬件条件也非常适合引入目前体积巨大的量子计算机。两者都需要安装在高度集成的计算中心,由专业技术团队管理和支持。
 
什么是量子计算机?量子计算机是一种按照量子力学规律进行高速数学和逻辑运算、存储和处理量子信息的物理设备。它不仅体积巨大,而且作为核心部件的“量子芯片”,通常需要放置在接近绝对零度(零下273.15摄氏度)的极低温度下,利用微观颗粒在这种极低温度下表现出来的量子特性进行信息运算和处理,运行结果只能存在几毫秒。
 
既然量子计算机“又大又难维护”,为什么还要发展?原因是量子计算机蕴含着巨大的计算能力潜力,以至于在一些算法中,它已经表现出了相对于电子计算机的“绝对碾压”,即“量子优越性”。然而,实现“量子优越性”只是一个起点。目前,量子计算机只能完成量子领域的一些计算任务。要真正利用好这种“量子优越性”,首先要让它有足够的量子位,实现通用计算和可编程。而且,实现通用计算后,量子计算机还是需要保持相对于电子优势的。
 
2022年,谷歌、微软、加州理工学院等机构的研究人员原则上证明,“量子优势”确实存在于预测可观测变量、量子主要成分分析和量子机器学习中。量子机器学习实际上是量子计算在人工智能领域的应用,也体现了量子计算与人工智能两大前沿技术合流的未来趋势。
 
理论上证明,在实践中,量子计算的应用前景需要进一步拓展。2019年商用量子计算机“量子系统一号”推出后,美国量子计算巨头IBM于2023年12月推出“量子系统二号”。新系统最大的突破就是可以模块化扩展,这是公司的第一台模块化量子计算机。“量子系统二号”有1000多个量子位。IBM还宣布计划在10年内建造10万个量子位的量子计算机。这些不断增加的量子位不仅仅是为了竞争,也是为了实现通用计算和可编程。
 
量子机学习算法的研究已经成为一个新的研究热点。然而,在未来,量子计算机不会完全取代电子计算机。更有可能的是,量子计算机和电子计算机在不同的应用场景下发挥各自的优势,实现协同发展,不仅大大提高了计算能力,而且兼顾了成本和可行性。
趋势四
 
AI代理和无代码软件开发带来了“冲击波”
 
就AI应用而言,2024年AI代理和无代码软件开发带来的“冲击波”值得关注。
 
第一,AI代理对劳动力结构的影响。
 
到目前为止,世界上至少有近2亿人使用人工智能模型。然而,人们不再满足于坐在电脑前与人工智能“聊天”,而是开始开发可以根据任务需要自动提示人工智能的工具。当自动提示工具与大模型相结合时,人工智能代理就诞生了。
 
2023年4月,OpenAI联合创始人布罗克曼现场展示了GPT的“自动模式”。在这次演示中,AI代理人几乎“安排”了一场晚宴:他们不仅按要求生成了一份推荐的晚宴菜单和一份图文并茂的邀请函,还自动在生鲜电商APP的购物车中添加了该菜单需要购买的食材,并自动发布了一份关于晚宴的社交网站帖子。
 
AI代理还可以根据模糊的需求提示自动制作网站,自动完成各种需要使用Office软件的文字和表格处理,甚至根据现有的论文数据自动总结生成分析论文。
 
比尔·盖茨最近发表了一篇关于AI代理未来的长文,称AI代理将彻底改变人们使用计算机的方式,从键盘、屏幕和鼠标发明开始,带来人类与计算机互动最重要的创新。
 
AI被认为是增强人类信息收集、分析和处理的扩展工具,使人们的工作水平达到了一个新的水平。然而,与此同时,AI代理也对许多现有的工作产生了影响,因为企业可能会尝试雇佣更少的人来完成同样的任务。这种对现有经济结构的创新破坏被美国经济学家熊彼特称为“创造性破坏”。随着AI代理取代大量只需要较少的计算机技能就能完成的任务,这些被迫再就业的劳动力将不得不适应新的劳动力市场需求,这注定是一个漫长而痛苦的过程。
 
第二,无代码软件开发对数字经济创新的影响。
 
虽然生成式人工智能可能会淘汰一批传统的数字职位,但它们在关闭一扇门的同时也打开了一扇窗户,这就是“无代码软件开发”。目前,基于AI模型的编程辅助工具已经发展到一个新的阶段,软件或网页代码可以根据用户模糊的指令生成。例如,在2023年的GPT-4演示中,演示者只在A4纸上写了一张非常潦草的结构示意图。GPT-4根据它自动生成一个可以实际访问的网页。这无疑大大降低了IT服务开发的门槛。只要一个人有足够的创意数字服务“想法”来满足很多人的需求,就可以成为互联网创新的出路,“每个人都可以创新”的时代已经到来。
 
在这方面,政府需要改变观念,兼顾市场监管和促进创新,一方面降低数字创新过程中的注册和融资门槛,打通中小企业发展壮大过程中的痛点,让就业和创新政策适应“每个人都可以创新”的新需求;另一方面,我们需要探索版权和专利保护新政策,这更有利于保护创新的“想法”,从而鼓励能够不断提出创新的“想法”的人才。
 
免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章