回顾 2024 年,无疑是 AI 应用爆发的一年。
大大小小层出不穷的应用产品涌现出来,乱花渐欲迷人眼,同一功能的产品甚至有十几款甚至几十款。
硅星人编辑部在年底,展开了一场激烈地讨论,究竟谁才是创作者最得力的 AI 助手?
最终,我们发现,不同的产品似乎只能解决某一个单点的工作环节,要想把所有的工作流在一款产品上解决,得出的答案是:没有。
真的没有么?
在 2024 年年尾,豆包电脑版 " 悄咪咪 " 的进行了一次重大更新,将豆包的属性,从一款从前以对话为主的产品,变成 AI 浏览器、文章编辑器、AIGC 生成的 All in one 产品,相较于此前碎片化的工作流,如果能在一款产品中完成所有环节,效率无疑将得到大幅度提升。
今天,我们就挑战只用豆包,不切换到任何一款产品,能不能完成高效创作。
做款不一样 AI 浏览器
熬了三个通宵,开了几十个网页,互联网上的资料五花八门,要在信息海洋里高效地找到有价值的信息,创作者们都知道,这里面门道有多深。
当我们习惯性地打开浏览器搜索时,却发现豆包不仅支持 AI 搜索,也摇身一变成为了一款浏览器,对于官网信息、财报、论文等一手资料源,可直接查找。当我把原来浏览器里的书签一键导入无缝切换后,在使用体验上,几乎和 Chrome 没有任何差别。
当 AI 与搜索开始结合,AI 搜索在过去的两年里演化成了两种形态:一是 LLM 本身具有搜索能力,在对话中通过搜索实时信息来生成准确回答;二是以 Perplexity 为代表的一类专门负责 AI 搜索的独立产品,无法直接生成内容。
当然,这两种形式对于用户来说相对便捷和无感,但往往只适用于二手信息的检索,对于搜索工具、服务、或者一手信源时,仍然需要打开浏览器,解决不了全部的问题,这也就导致了,创作者在 AI 搜索后,仍然需要通过传统搜索的方式来补充和确认信息。
在豆包电脑版里,不仅将上述两种形态结合在一起,同时也考虑到使用场景中的真实需求,保留了浏览器的原生能力。
让人惊喜的是,虽然功能极为复杂,但通过豆包的产品能力,依然保持了简洁的页面、简单的操作,哪怕是新手也能直接操作。
当我们提出一个准确地问题,需要高效地整合型的,直接获取答案,可以选择直接 " 问问豆包 ",进入到对话页面。
但有时候,我们也需要对现有的信息进行整理,来形成思考的链路,这时我们可以直接选择 AI 搜索,同时在 AI 搜索中,点击右上角「回原网页」便可以跳转回百度搜索页面。
但豆包电脑版浏览器功能并不是只为了构建浏览器本身,更重要的是,有了浏览器作为载体,浏览中可以更方便地调起 AI 协助。
比如在研究 AI 技术的过程中,创作者经常会查找和阅读许多论文,但外行看总是一个头两个大,对于很多名词的翻译和理解并不准确,豆包中配备学术搜索功能,在浏览中可随时划线 AI 搜索,翻译原文。
文字是搞懂了,但一涉及到图形演示或者数学问题,又犯了难。
在豆包电脑版浏览器功能中配备了「截图搜索」这一功能,在某一部分图像看不懂的时候,可以直接截图,使用豆包分析其中含义。
如果想快速高效地浏览一篇论文,也可以对网页进行总结,直接生成脑图,帮助我们快速了解论文里的复杂信息,同时可以针对网页内容进行音频播放,扩大使用场景。
除此之外,豆包还考虑到了,除了文字内容,创作者往往也需要大量浏览音频博客和视频一类更复杂的内容形式,豆包电脑版浏览器功能升级了理解图片和视频的视觉理解能力。
最近两周,整个科技圈都在跟进 OpenAI 的实时转播, 恨不得逐帧观看反复研究。通过豆包电脑版浏览器功能观看视频,能够理解和总结视频,甚至能够通过搜索关键词直接定位视频内容,就算落下了几天也不怕,在研究中也可以精准地搜索到 "Sam Altman 的原话 " 或者 " 关于 o1 有哪些更新 ",再也不必凭着记忆一帧一帧地找视频了。
搜索、浏览、翻译、整理总结,在全新的豆包电脑版浏览器功能里,查阅资料变成了一件更简单的事。更让编辑部感慨的是,相比于在 Chrome 里按一堆插件,豆包电脑版浏览器功能好像更懂 " 我 " 的需求,也更加便捷。
边写边查边改,不让电脑屏幕忙到冒烟
从前,搜索和撰写必须在不同的产品里,从网页里把有效信息提取出来,进行整理和加工。
这就导致了电脑屏幕往往被分成两块,或者安装多块屏。
而这不单单只是效率问题,两边复制粘贴,两个页面来回切换,经常会出现 bug 和格式错误,影响创作内容的准确性。
相信每一个创作者都经历过这样的 " 痛 "。在 AI 来了以后,本以为能提效的我们发现又更多了一个修改环节:查资料——大模型写初稿——复制粘贴在编辑器中——人工修改。
这个过程产生了一个更长的链条,中间无形的效率损耗非常大。
那么问题来了,能不能一边查一边生成,还能一边改?
豆包电脑版推出了「对话+编辑」一体的编辑器,页面形态与 ChatGPT Canvas 类似,但使用起来更符合创作者创作习惯,细化了产品功能,AI 生成和创作者修改有机的融合在一起,打开了一种新的人机写作方式。
硅星人提前内测了豆包的编辑器功能,在对话入口或帮我写作入口输入写作指令字数大于 300 字时便可自动触发编辑器,无缝丝滑切换到写作模式,在一个页面几乎能搞定所有难题。
左边是自由对话页面,在左侧对话框提出框架需求在右侧生成一份更详尽的框架,并通过多轮对话来完善框架内容,分点、分层次、清晰有序的展现文章的逻辑和结构。
在豆包生成初稿后,创作者可以对生成的内容进行二次创作和编排,在创作中,如果对某一段落不满意,可直接在对话中提出修改意见,进行局部的修改并在文中直接生成,不会像传统 AI 那样,重新生成一篇全新的文章,产生过量文字使得最终的写作效率降低。
左边提出需求,右侧为生成结果
当然,在编辑器中创作者也可以随时 AI 改写和自主修改,支持对全文或指定段落句子进行扩写 / 润色 / 缩写等 AI 改写功能,也可自定义提示词,仅修改目标段落或句子,进行自主替换。
比如第一段豆包的生成结果稍微口语化,我们需要更严肃的商业报道时,通过 Prompt 将其调整为更加书面的文本,并可以自由选择整段替换或部分替换,提高了编辑的灵活性。
我们发现,每一个需求豆包编辑器都能够生成一份独立的文档云端存储,方便后续找回。
最后,我们可以使用全文优化的功能,对刚刚分段修改后的文章的语言重新润色一遍,来保证文章的整体性和一致性。
图为全文润色后的生成结果
当超出了文章的范畴,比如写研报和论文,则需要更强的逻辑结构和关联性,豆包的分步骤写作功能,支持万字以上超长文本的写作,并支持三级标题,将复杂任务结构化拆解,创作者可以对大纲的每个部分进行细节修改,直到满意为止。
在分步骤写作中,AI 撰写也可以变得越来越 " 像你 ",将作者过往的作品发给豆包,豆包即可模仿语言风格和文章调性,进行更加个性化的生产。
这些表面上看似独立的能力,实际上都是在服务于同一个目标:确保生成内容的高度可用性。从辅助创作到直接生成可用的成果,AI 正在重塑人机交互的全新方式。
从产品形态来看,豆包编辑器与 10 月份 OpenAI 推出的 Canvas 编辑器的页面布局类似,二者都不约而同地选择了将「对话」和「编辑」功能集成的形态,构建一种全新的人机协作范式,来试图打开 AI 和人类共创的时代。
懂事的 AI 编辑器,连图都不用自己找
在图文创作过程中,图像是不可或缺的重要组成部分。但对于大多数文字工作者而言,虽然撰写文字内容相对容易,但寻找合适的图片素材往往望而生阻。
特别是在要求图片与上下文语境相符,且不涉及版权问题的情况下,寻找适合的素材更加艰难。
过去我们常常通过文生图工具进行二次创作,但这需要重新编写 Prompt,有时还会因为不熟悉专业术语而产生乱码,使得生成的图像根本无法用于文章之中。
懂事的豆包编辑器,连配图也能够联系上下文语义和对整篇文章的掌握,理解和生成更适合的插图内容,甚至不用提出 Prompt。
在编辑器中,直接点击➕,即可调用全网搜图或 AI 生图能力,甚至不用提出新的提示词,根据上下文语义,对于 " 灵感的创意工坊 " 这个比喻,生成了带有魔法的提示板。如果对于生成结果不满意,可重新生成新的图片。
当然,我们也可以在对话中直接提出新的提示词,来更准确的描述图片信息。如上图,豆包生成了 "AI 搜索:信息的高速公路 ",根据这个创意,我们提出了一个简单的图片构思,随机豆包的插图功能生成了四张插画风格的插图。
相信眼尖的你也注意到了,没错,在豆包电脑版中,也上新了此前 " 可控中文生成的能力 "。豆包精准的生成了带有信息字符的高速公路,甚至在 4 张图片中,分别放在了不同位置。
不过,对于以图像为主文字为辅的创作者来说,对于图片的二创往往是常态,比如下面这张图中,明显广告牌中出现了乱码,我们分别使用了 " 区域重绘 " 能力,提出了新的 Prompt,将广告牌变成了树," 擦除 " 和 " 扩图 " 三种不同的修改方式,对下图进行了实时编辑,最终保证可用的效果。
当然,基于图片和文字这两种比较基础的内容形态,据悉紧跟着豆包电脑版还将上线 PPT 生成能力,打工人的天菜能力终于要上线了!
另外,万众期待的视频生成的能力也在内测中了,刚刚 OpenAI 在 Canvas 中更新的代码能力,也可以小小的期待一下。
至此,豆包真的是集搜索、写稿、生图、视频为一身,不知道各位认为这次的挑战是否成功呢?
结尾:
新石器时代,人类首次将木斧、锥器、火石等工具集成到一起使用,孕育了有史以来第一次工具革命。如今,AI 驱动的 All in One 平台出现,将多种功能融为一体,为知识创作带来了深刻的变革。
不同于过去工具割裂的状态,All in One 平台正在重塑创作者的思维和创作方式,开启了全新的创作范式。创作者不再被工具所局限,反过来工具组也在重塑人类的认知方式。这不仅提高了创作效率,更重要的是催生了人机深度交互的创作模式。
从另一个角度来看,在一个 AI 爆发的新时代,用户都是 " 用脚投票 ",All in one 的背后也是用户在不同的场景下都愿意选择豆包的一种自然的结果。一方面,多模态的输入、多端的部署,让豆包在用户身边无所不在,问问豆包最快、最及时。
另一方面,问问豆包最 " 快 " 也不仅是速度上的,更是因为有效,用最简单、最直观的方式给出答案。不需要再花心思去翻书或者上网搜索,只需要提出问题,尤其在豆包电脑版集成了几乎所有能力后,真正做到了什么都问问豆包。
All in One 平台的无缝集成,标志着 AI 辅助创作向成熟阶段迈进。它汇集了人类智慧和 AI 能力,为知识生产力带来新的大规模提升。这不只是简单的功能集成,更是 AI 辅助走向成熟的必由之路。
登录后才可以发布评论哦
打开小程序可以发布评论哦