AIGC 发展方向的思考(一)

AIGC发展 AI技术 商业逻辑 数据训练 中美科技竞争
飞书发布会未提及AI,引发猜测:可能不符合产品定位、受中美竞争影响或技术未跟上。作者认为,技术未跟上的可能性更大,因为字节跳动在商业化压力下,难以像OpenAI那样专注于技术研究。然而,字节跳动在数据量和工程能力上具备优势,若能调整决心和商业逻辑,仍有追赶的机会。
文章内容
思维导图
常见问题
社交分享

飞书上周发布会,只字未提 AI,让我有些意外。比如 AI 跟飞书套件的联动,飞书妙记的一键总结、或者类似 notion AI 的文档编写建议,一概没有。会是有什么原因?几个猜测:

  1. 不符合产品宣传定位;
  2. 跟中美竞争有关,有意不发布、隐藏实力;
  3. 来不及,技术还没跟上;

作为“先进组织”的 slogan 和产品定位,加上 AI 的热度势头,即使发布一些简单产品,也足以获得不少好感。所以不可能是产品定位原因。

而去年,美国政府已经限制了高端 GPU 的出口,最近中美竞争波及 TikTok,如果字节再在 AI 上有大迈步的动作,恐怕有进一步影响。又或者不想喂数据给 OpenAI,涉及很多企业核心机密,这方面可能有所考虑。

但更可能的原因,我认为应该还是来不及。OpenAI 之前是作为非盈利组织存在,直到最近两年微软注资才开始商业化。但整体的组织方式,出发点都是纯粹研究好这项技术,而不是非得要有什么落地。这在 OKR 考核、要求短时间出业绩背景下的字节,固然很难诞生。即使是飞书妙记会议总结这种那么接近自然语言理解的场景,也一定会加上类似“帮助 bd 多少企业版客户”的商业化指标,没往模型那块去想,这是落地性太强所导致的负面作用。

但我认为字节还是很有机会跟上的,因为大模型的核心是训练数据量,并且是清洗后的数据量。GPT-2 稍微展露头脚,就是训练数据量的提升导致的质变,而近几个月的 3、3.5 到 4,同样是训练数据量的量级提升。字节的推荐引擎(头条+抖音),拥有不输的数据量和经验,全球最大的内容审核团队也能为之所用,而工程能力更加是不差。更大的影响因素,可能是决心和商业逻辑。

思维导图生成中,请稍候...

问题 1: 为什么飞书在最近的发布会上没有提到 AI 相关的功能?
回答: 可能的原因包括:不符合产品宣传定位、中美竞争背景下有意隐藏实力,或者技术尚未跟上。

问题 2: 中美竞争对字节跳动在 AI 领域的发展有何影响?
回答: 中美竞争可能导致字节跳动在 AI 领域采取更谨慎的策略,避免因技术发展引发进一步的国际压力或数据安全问题。

问题 3: 为什么字节跳动在 AI 技术上的进展可能“来不及”?
回答: 字节跳动的组织方式更注重短期商业化目标,而 AI 大模型的研发需要长期投入和纯粹的技术研究,这与字节的 OKR 考核体系存在冲突。

问题 4: 字节跳动在 AI 领域有哪些潜在优势?
回答: 字节跳动拥有庞大的训练数据量(如头条和抖音)、全球最大的内容审核团队以及强大的工程能力,这些为其在 AI 领域的发展提供了坚实基础。

问题 5: 训练数据量对 AI 大模型的发展有多重要?
回答: 训练数据量是 AI 大模型发展的核心因素,数据量的提升(如 GPT 系列的演进)直接推动了模型性能的质变。

问题 6: 字节跳动在 AI 领域的最大挑战是什么?
回答: 最大的挑战可能是如何平衡短期商业化目标和长期技术研发,以及是否具备足够的决心和商业逻辑来推动 AI 技术的发展。

问题 7: 飞书妙记的会议总结功能为何没有深入 AI 模型研发?
回答: 飞书妙记更注重商业化落地,如帮助企业客户提升效率,而非纯粹的技术研究,这限制了其在 AI 模型上的深入探索。

问题 8: 字节跳动能否在 AI 领域赶上 OpenAI 的步伐?
回答: 字节跳动在数据量和工程能力上具备优势,但能否赶上 OpenAI 取决于其是否能在技术研发和商业化之间找到平衡,并投入足够的资源。