没有互联网,就没有今天的人工智能。
作者|栗子
你知道中国首次连接互联网是在什么地方吗?
北京市中关村南四街4号的中科院计算机网络信息中心2号楼前的纪念牌,记录着中国互联网“梦开始的地方”。
中国互联网30年时光长廊:中国互联网诞生地,图片来源:「甲子光年」拍摄
1994年4月20日,由中国科学院主持,联合北京大学、清华大学共同实施的世界银行贷款项目“中关村地区教育与科研示范网络(NCFC)”通过美国Sprint公司连入Internet的64K国际专线开通,标志着中国首次实现了与互联网的全功能连接。这一天也成为了中国互联网的诞生日。
30年前,网络生存似乎还难以想象。
1999年9月,一场名为“72小时网络生存测试”在北上广三地同时举行。12名参赛者被分别安排12个酒店房间内,房间内只有一个可拨号上网的Windows 95台式电脑,一卷卫生纸和一张光板床,参赛者需要依靠主办方提供的1500元现金和1500元电子货币在房间内生存72小时。最后,有一名毫无网络经验的参赛者因买不到食物和水不得不遗憾退赛。
在退赛时,这名参赛者曾发出这样的感慨:“我不知道中国未来是否还能接受我这样零网络经验的人?”
而30年后的今天,互联网早已渗透进每个人工作生活的方方面面。外卖、打车、购物、游戏……几乎所有事情都与网络有关。对于今天的人们来说,也许“无网络生存”才是挑战。
与互联网类似,今天人们正在离不开的,还有人工智能。
近年来,随着人工智能取得突破性的进展,人工智能正在从原始创新为特征的研发带动阶段,进入应用创新为特征的赋能实体经济阶段。
在中国实现全功能接入国际互联网30周年之际,由中国互联网协会主办的2024中国互联网大会在北京召开。360创始人周鸿祎,猎豹移动董事长兼首席执行官、猎户星空董事长傅盛,昆仑万维科技股份有限公司董事长兼CEO方汉等“站在互联网与人工智能十字路口”的创业者悉数到场,回顾了互联网的过去,并展望了人工智能的未来。
30年,中国的互联网和人工智能大模型,第一次走到了交汇的十字路口。
1.互联网与人工智能的相交
中国互联网30年时光长廊,图片来源:「甲子光年」拍摄
从1994年首次接入互联网之后,中国的互联网产业就按下了加速键。
1997~2000年,丁磊的网易、张朝阳的搜狐、马化腾的腾讯、马云的阿里巴巴、李彦宏的百度先后成立。它们不仅是当时中国互联网的门面,更在接下来的20多年里,成长为如今各自领域的巨头企业,成了人们工作生活离不开的基础设施。
中国互联网30年时光长廊:互联网创业黄金年,图片来源:「甲子光年」拍摄
2010年1月,中国第一家团购网站满座网上线,当年底,中国团购网站数量就超过千家,被媒体誉为“千团大战”。而团购网站的兴起,也为后续O2O的流行拉开了大幕。今天我们早已习惯的“线上下单,线下消费”,就是来源于当年的团购时代。
中国互联网30年时光长廊:千团大战,图片来源:「甲子光年」拍摄
2011~2016年,随着3G、4G通讯技术的不断发展,移动互联网开始快速普及。今天的国民应用“微信”,正诞生于那个年代。
与此同时,影响今天我们生活的还有互联网第三方支付。2011年5月18日,中国人民银行下发首批27张第三方支付牌照,自此,人们在网上支付不必再依赖于复杂的网银系统,打车、外卖、娱乐等等平台经济产品才得以而生。
但从2017年开始,互联网的发展似乎进入了瓶颈期。很多我们非常熟悉的网红App,其中一部分都永远停留在了那个时代。大家不再热衷于关注App Store的应用排行榜,红极一时的“豌豆荚”也被2亿美元“贱卖”。人们的目光开始从互联网应用转向区块链、元宇宙、Web3……
不过,科技浪潮永远不缺乏新的技术,新的变革。同样是在当时,人工智能开始像聚光灯一样照耀在舞台中央。
2016年3月,围棋人工智能程序AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;
2017年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;
2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
当时,围棋被誉为是“计算量最大的棋类竞赛”,而AlphaGo在围棋上展现出的惊人能力,让普通人第一次见识到人工智能的强大,也让很多人第一次听到“神经网络”“深度学习”等人工智能的专有名词。
而近两年,人工智能技术再次被几乎全世界所有人熟知。尤其是2022年底OpenAI发布ChatGPT之后,人们被人工智能大模型的能力所震撼。很多人开始认真讨论“通用人工智能何时到来”“人工智能是核弹级技术”“是否应该把技术关在笼子里”。
百川智能创始人王小川曾经甚至直言“这就是通用人工智能”。
无论现在的AI大模型是否是通用人工智能,一个共识已然被企业接纳与认可:今天互联网的所有业态都有可能在大模型能力的加持下重做一次。
经历了30年的发展,中国的互联网和人工智能技术,第一次走到了交汇的十字路口。
2.没有互联网,就没有今天的人工智能
人工智能技术的发展起源可以追溯到20世纪中叶,其历史演进经历了多个重要阶段。
1956年被称为人工智能元年。在当年的达特茅斯会议上,“人工智能”这一概念被首次提出,开启了人类探索人工智能的大门。
在起步发展期,人工智能取得了一系列令人瞩目的成果,例如机器定理证明和跳棋程序,这些成果掀起了人工智能发展的第一个高潮。
然而,随着时间推移,人工智能的发展并非一帆风顺。20世纪60年代至70年代初,由于一些不切实际的研发目标未能实现,人工智能进入了反思发展期,遭遇了发展的低谷 。
20世纪70年代初至80年代中,专家系统的出现推动了人工智能从理论研究走向实际应用,实现了人工智能的重大突破,这一时期被称为应用发展期。但随后,由于专家系统存在的一系列问题,如应用领域狭窄和知识获取困难,人工智能又进入了低迷发展期。
进入20世纪90年代中至2010年,互联网技术的发展加速了人工智能的创新研究,促使其进一步走向实用化,这一时期被称为稳步发展期。1997年,IBM的深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,成为这一时期的标志性事件。
2011年至今,随着大数据、云计算、互联网和物联网等信息技术的发展,人工智能迎来了蓬勃发展期。深度神经网络等技术推动了图像分类、语音识别、知识问答等领域的技术突破,人工智能技术实现了从“不能用、不好用”到“可以用”的跨越,迎来了爆发式增长的新高潮。
乍看上去,互联网与人工智能是两种不同的技术,但二者却有着明显的先后顺序。事实上,人工智能技术的发展,是建立在互联网技术逐步成熟的基础之上,而并非凭空而生。
互联网作为基础设施,为人工智能提供了三方面基础:用户、数据、算法与算力。
首先,互联网服务了全球数十亿网民。截止2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%,其中手机网民占比高达99.9%。
其次,这些网民在网络上的行为,又为人工智能在模型训练中提供了海量数据。例如,抖音、快手等短视频应用的出现,让网络视频用户规模呈现爆发式增长。截至2023年年底,我国网络视频用户规模为10.67亿人,较2007年的网络影视用户规模扩大了5倍多。这些用户促进了平台内容的产出,而这些内容又给模型训练提供了数据。
最后,互联网技术的持续迭代,为人工智能提供了大数据、云计算、推荐算法等一系列软硬件基础设施。例如我们非常熟悉的今日头条,就是依靠推荐算法在App中实现千人千面。“你关心的,才是头条”这句话,当年也一度是今日头条的开屏slogen。
用户、数据、算法与算力,构成了今天人工智能得以爆发的底层支撑。
在360创始人周鸿祎看来,中国互联网发展30年,并不只是为今天的我们贡献了用户、数据、算法与算力。它还带给了我们很多前所未有的商业创新和技术创新,例如社交网络、搜索、电商、O2O服务等,让我们每个人的生活都更加高效便利。
更为重要的是,互联网给中国带来了一种更积极、更热血澎湃的创业创新状态。正如电影《中国合伙人》的原型,俞敏洪、徐小平、王强创办新东方一样。互联网让很多普通的草根民众、个人站长、代码工程师等,都有机会借助技术之风快速崛起。
在那个“大众创业、万众创新”的时代,北京中关村创业大街的3W咖啡,每天都坐满了怀揣梦想的年轻人。尽管过程中有人成功有人失败,但那都是一个波澜壮阔的精彩历程。
而今天的人工智能大模型,仿佛就像互联网在国内发展的昨日重现。今天已经出现了非常多人工智能技术改变人们生活的案例,AIGC创作、自动驾驶、AI搜索等等。
这就好像10年前互联网时代的创业热潮非常让人激动人心,期待每天都有新应用,每天都有新知识。
“我认为今天人工智能所有创业者,都应该继承互联网30年留下来的创业精神,这才是互联网真正留给人工智能最有价值的东西。”周鸿祎在2024中国互联网大会上说。
3.人工智能的未来究竟是什么?
60多年来,人工智能经历了数轮起落,均兴起于技术突破、衰于脱实向虚。人工智能的前路究竟如何发展,从业者们还需要解答好几个必须面对的问题。
第一个问题,Scaling Law到底是否是通往AGI的最优路径?
「甲子光年」在中国互联网大会上注意到,在这个问题上,北京大学国际数学研究中心博雅特聘教授、国际机器学习研究中心副主任董彬的观点是,自己并不看好Scaling Law,并且认为Scaling Law可能在一两年内就会达到极限。
但同时他认为在Scaling Law真的失效之前,还是应该探索一下它的极限到底在哪里。
但需要注意的是,事实上Scaling Law是有很多前提的。
昆仑万维科技股份有限公司董事长兼CEO方汉给出了关于Scaling Law非常具体的观点。
在方汉看来,Scaling Law在不同领域的放缓速度是不一样的。例如人类文本领域的数据量大约是1亿亿Token的量级,图片则是万亿Token量级,再往下计算,全球历史上只有4000万首歌,而3D模型的数量则更少,只有1200万个3D模型。
随着数据量和数据规模的缩小,Scaling Law放缓的速度也在加快,也就能够越快速取得SOTA(在该项研究任务中,目前最好的模型的结果/性能/表现)。
换句话说,目前Scaling Law仅在文本领域依然是生效的,但在所有其他领域都已经放缓了。
与此同时董彬也补充表示:“Scaling Law有很多前提,比如现在我们是在Transformer架构下探索Scaling Law,但Transformer大概率不是大模型的最优解。那么如果我们更换架构,又要重新去探索Scaling Law。并且数据质量对Scaling Law的结果也有非常大的影响。在高质量数据集训练的情况下,我们能够观测到非常不一样的Scaling Law。”
猎豹移动董事长兼首席执行官、猎户星空董事长傅盛从另外一个角度给出了自己对Scaling Law的看法,那就是多元化。
在傅盛看来,所有的地方都可以找出差异化的机会,并且Scaling Law是一件非常消耗算力和成本的事情,我们不需要很多家企业都去探索Scaling Law。
“创业创新的底层逻辑就是需要寻找差异化。只有独特才有价值。很多创业者一上来就说自己要做万亿级市场。但真的有几家公司能做到千亿甚至百亿市值呢?哪怕10亿就是很不错的公司了。”
傅盛认为,人工智能创业,一定不要去卷Scaling Law、卷性能,而是要结合应用寻找人工智能落地的机会。
第二个问题,具身智能是否是人工智能的未来?
今天业内的一个很普遍的观点是,人工智能的未来趋势一定是具身智能。一个非常强有力的佐证是,今天人工智能底层的芯片巨头英伟达,在GTC2024大会上发布了人形机器人通用基础模型Project GR00T和新型计算机Jetson Thor。
具身智能是一种先进的机器智能形式,它不仅具备自主决策和行动能力,还能像人类一样感知和理解环境。尽管具身智能的物理形态并不一定是人形机器人,但今天很多具身智能企业都在探索人形机器人,包括英伟达。
在刚刚结束的2024世界人工智能大会展区,人形机器人先锋阵列的“十八金刚”也吸引了不少人围观。
世界人工智能大会展区,图片来源:「甲子光年」拍摄
但是关于人形机器人,傅盛是旗帜鲜明的持反对意见。
傅盛的观点是,今天人们对人形机器人的探索思路是非常值得商榷的。因为从历史维度讲,世界上从未有过任何一次创新,是直接做出来一个全能型的产品向全世界推广,而是从小处出发,逐步迭代试错。
“但你看今天的人形机器人,都是一上来就要造一个能走能跳,还能翻跟头的机器人,期待着这样一个机器人出来,把全世界的问题都解决掉。这个思路本身就是错的。它一定是从轮式开始,一点点迭代。而且它也不需要一定是人形的机器人。人形机器人本质上是人类的自我崇拜。”
当然,人工智能的未来发展也并非完全只有具身智能这一条路。
达武创投创服项目负责人王楠认为,站在经济视角,就会发现人工智能有机会在三层经济中实现爆发——地面经济、低空经济以及未来的太空经济。
地面经济是人们目前正在经历的。如今,人工智能开始越来越多的赋能车企与自动驾驶公司研发自动驾驶技术,像百度萝卜快跑、滴滴自动驾驶等自动驾驶产品也已经在国内部分道路进行运营。
而未来的低空经济与太空经济,也必然会在人工智能大模型的能力支持下产生更多的机会。
另外,方汉在大会现场,从市场角度补充表达了两个机会——“下沉”与“出海”。
从互联网与人工智能发展历程的视角看,今天中国的人工智能产业,与1995年中国互联网产业非常相似。当时也只有北京和上海能够接入互联网,就像今天的人工智能一样。所以下沉市场对很多人工智能企业来说都是摆在眼前的巨大机会。
而出海也是很多国内企业值得布局的市场。尽管海外有OpenAI、Anthropic、DeepMind等一众顶级厂商,但人工智能能够实现的文化平权和语言平权,是中国企业和工程师们的很大发展机会。在竞争当中只要找准自己的定位与差异化,就有机会搏出一席之地。
随着人工智能技术的不断演进,人们站在了一个新的起点。互联网与人工智能的交汇,不仅仅是技术的融合,更是思想与创新的碰撞。正如周鸿祎所言,互联网留给人工智能的,是一份创业精神的传承,是对未来无限可能的探索与追求。
(封面图来源:「甲子光年」使用AI工具生成)