前言
2月16日,OpenAI发布了其最新的文本控制视频生成模型”Sora”,这个突破性的扩散模型通过生成多段高质量视频,展现了生成式AI技术的又一里程碑。与Pika等尚处于用多张图像生成几秒视频阶段的AI工具不同,Sora通过在视频和图像的压缩潜在空间中进行训练,将其分解为时空位置补丁,实现了可扩展的视频生成能力。更令人惊叹的是,该模型还展现出模拟物理世界和数字世界的强大能力,其生成的60秒演示视频堪称”物理世界的通用模拟器”。
从技术架构来看,Sora延续了GPT模型”源数据-Transformer-Diffusion-涌现”的技术路线,这意味着其发展同样需要强大算力支撑。考虑到视频训练所需数据量远超文本训练,对算力的需求将呈指数级增长。我们在早期文章《潜力赛道前瞻:去中心化算力市场》中已探讨过算力在AI时代的关键地位。随着近期AI热潮持续升温,市场上涌现出大量算力相关项目,而被动受益的Depin项目(如存储、算力等)也已迎来一波显著上涨。这不禁让人思考:除了Depin之外,Web3与AI还能碰撞出怎样的火花?这条赛道中还蕴藏着哪些机遇?本文旨在对过往观点进行更新与补充,并探讨AI时代下Web3的潜在发展方向。
AI发展史的三大方向
人工智能作为一门旨在模拟、扩展和增强人类智能的新兴科学技术,自20世纪五六十年代诞生以来,经过半个多世纪的发展,已成为推动社会变革的重要力量。在这一演进过程中,符号主义、连接主义和行为主义三大研究方向的交织发展,奠定了当今AI技术突飞猛进的基础。
符号主义(Symbolism)
符号主义又称逻辑主义或规则主义,主张通过符号处理来模拟人类智能。这种方法利用符号表示问题领域内的对象、概念及其相互关系,并借助逻辑推理解决问题,在专家系统和知识表示方面取得了显著成就。其核心观点认为,智能行为可以通过符号操作和逻辑推理实现,其中符号代表了对现实世界的高度抽象。
连接主义(Connectionism)
连接主义或称神经网络方法,通过模仿人脑结构和功能来实现智能。该方法构建由大量简单处理单元(类似神经元)组成的网络,通过调整单元间连接强度(类似突触)进行学习。连接主义特别强调从数据中学习和泛化的能力,在模式识别、分类及连续输入输出映射问题上表现优异。作为其发展的深度学习技术,已在图像识别、语音识别和自然语言处理等领域取得突破性进展。
行为主义(Behaviorism)
行为主义与仿生机器人学和自主智能系统研究密切相关,强调智能体通过与环境的交互学习。不同于前两种方法,行为主义不关注内部表征或思维过程的模拟,而是通过感知-行动的循环实现适应性行为。这种方法在复杂不可预测环境中行动的移动机器人和自适应控制系统应用中展现出独特优势。
尽管这三种研究路径存在本质差异,但在实际AI研究和应用中,它们往往相互融合、相互促进,共同推动着AI领域的创新发展。
AIGC原理概述
当前呈现爆发式增长的生成式AI(AIGC)正是连接主义的演化应用,这类技术能够模仿人类创造力生成新颖内容。AIGC模型通过大型数据集和深度学习算法训练,学习数据中的底层结构、关系和模式,根据用户输入提示生成包括图像、视频、代码、音乐、设计、翻译、问答和文本等多种形式的输出。现代AIGC系统主要由三大要素构成:深度学习、大数据和大规模算力。
深度学习
深度学习作为机器学习的子领域,其算法模仿人脑结构构建神经网络。就像人脑中数百万神经元协同工作处理信息一样,深度学习神经网络由多层人工神经元(节点)组成,通过数学计算处理数据。这些网络能够解决日益复杂的现实问题。
神经网络通常分为输入层、隐藏层和输出层,各层之间通过参数连接。输入层负责接收外部数据,每个神经元对应一个数据特征;隐藏层在不同层级处理信息,通过数百个层级从多角度分析问题;输出层则生成最终结果。连接各层的权重和偏置参数在训练过程中不断优化,使网络能够准确识别数据模式。虽然增加参数能提升模型容量,但也会大幅提高算力需求。
大数据
有效的神经网络训练需要大量、多样且高质量的数据源。大数据是机器学习模型训练和验证的基础,通过分析这些数据,模型能够学习其中的模式和关系,进而做出准确预测或分类。
大规模算力
神经网络的多层复杂结构、海量参数、大数据处理需求、迭代训练过程、高精度计算要求、并行计算能力以及优化技术等因素,共同导致了其对高性能计算的强烈依赖。
Sora
作为OpenAI最新发布的视频生成模型,Sora代表了AI处理视觉数据能力的重大突破。通过视频压缩网络和时空补丁技术,Sora能够将全球不同设备拍摄的多样化视觉数据转换为统一表现形式,实现对复杂视觉内容的高效处理。基于文本条件的Diffusion模型使Sora能够生成与提示高度匹配的视频或图像,展现出惊人的创造力和适应性。
尽管Sora在视频生成和现实世界模拟方面取得突破,但仍存在物理模拟准确性、长视频一致性、复杂指令理解以及训练效率等局限。本质上,Sora仍是OpenAI通过垄断级算力和先发优势,延续”大数据-Transformer-Diffusion-涌现”技术路线的产物,其他AI公司仍存在技术超车的可能性。
虽然Sora与区块链的直接关联有限,但其影响将促使高质量AI生成工具快速发展,并辐射到Web3的GameFi、社交、创作平台、Depin等多个领域。了解Sora的发展对思考未来AI与Web3的有效结合具有重要意义。
AI x Web3的四大路径
如前所述,生成式AI的基础架构主要包含算法、数据和算力三大要素,而区块链的核心价值在于重构生产关系和去中心化。两者的结合可能催生出以下四种发展路径:
去中心化算力
AI对算力的需求在Sora问世后已达到惊人水平。OpenAI CEO山姆·奥特曼近期甚至提出融资7万亿美元重塑全球半导体产业的计划,凸显算力资源的战略重要性。区块链技术能够有效解决算力垄断和专用GPU成本高昂的问题。从AI需求角度,算力使用可分为训练和推理两个方向,前者技术门槛高且落地困难,后者相对简单,是目前的主流方向。
尽管去中心化算力市场想象空间巨大,但近期涌现的大量项目普遍存在同质化严重、设计粗糙等问题,仅靠”去中心化”口号难以与传统AI赛道竞争。
算法、模型协作系统
机器学习算法作为AI模型训练的核心,各自针对特定领域设计。Bittensor等项目试图通过挖矿激励实现不同AI模型和算法的协作学习,创造更高效的复合模型。虽然这种协作生态叙事新颖,但头部AI公司的闭源算法和快速迭代能力,使得这类项目需要在特定领域寻找差异化发展路径。
去中心化大数据
区块链与AI数据的结合存在多种可能:从简单的数据标注和喂养,到复杂的区块链数据机器学习应用。当前区块链数据获取存在诸多障碍,而通过ZKML技术结合高质量区块链数据,可能创造出降低访问门槛的创新解决方案,为开发者提供更丰富的数据资源。
AI赋能Dapp
自ChatGPT3爆火以来,AI赋能Dapp已成为常见方向。生成式AI可通过API接入,智能化各类区块链应用。随着Sora等技术的进步,AI在GameFi和创作平台领域的应用尤其值得关注。Web3的社区文化可能催生大量创意内容,打破与传统行业的壁垒。
结语
随着生成式AI技术的持续突破,我们将见证更多划时代的创新。尽管AI与Web3的结合仍处于探索阶段,但这条赛道很可能成为下个牛市的主流。保持开放心态接纳新技术至关重要,历史表明,固守偏见往往会错失转型机遇。
声明:文章不代表CHAINTT观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险 自担!转载请注明出处:https://www.chaintt.cn/11946.html