硅星人 昨天
干活不再东挑西选,一个豆包电脑版All in One!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

回顾 2024 年,无疑是 AI 应用爆发的一年。

大大小小层出不穷的应用产品涌现出来,乱花渐欲迷人眼,同一功能的产品甚至有十几款甚至几十款。

硅星人编辑部在年底,展开了一场激烈地讨论,究竟谁才是创作者最得力的 AI 助手?

最终,我们发现,不同的产品似乎只能解决某一个单点的工作环节,要想把所有的工作流在一款产品上解决,得出的答案是:没有。

真的没有么?

在 2024 年年尾,豆包电脑版 " 悄咪咪 " 的进行了一次重大更新,将豆包的属性,从一款从前以对话为主的产品,变成 AI 浏览器、文章编辑器、AIGC 生成的 All in one 产品,相较于此前碎片化的工作流,如果能在一款产品中完成所有环节,效率无疑将得到大幅度提升。

今天,我们就挑战只用豆包,不切换到任何一款产品,能不能完成高效创作。

做款不一样 AI 浏览器

熬了三个通宵,开了几十个网页,互联网上的资料五花八门,要在信息海洋里高效地找到有价值的信息,创作者们都知道,这里面门道有多深。

当我们习惯性地打开浏览器搜索时,却发现豆包不仅支持 AI 搜索,也摇身一变成为了一款浏览器,对于官网信息、财报、论文等一手资料源,可直接查找。当我把原来浏览器里的书签一键导入无缝切换后,在使用体验上,几乎和 Chrome 没有任何差别。

当 AI 与搜索开始结合,AI 搜索在过去的两年里演化成了两种形态:一是 LLM 本身具有搜索能力,在对话中通过搜索实时信息来生成准确回答;二是以 Perplexity 为代表的一类专门负责 AI 搜索的独立产品,无法直接生成内容。

当然,这两种形式对于用户来说相对便捷和无感,但往往只适用于二手信息的检索,对于搜索工具、服务、或者一手信源时,仍然需要打开浏览器,解决不了全部的问题,这也就导致了,创作者在 AI 搜索后,仍然需要通过传统搜索的方式来补充和确认信息。

在豆包电脑版里,不仅将上述两种形态结合在一起,同时也考虑到使用场景中的真实需求,保留了浏览器的原生能力。

让人惊喜的是,虽然功能极为复杂,但通过豆包的产品能力,依然保持了简洁的页面、简单的操作,哪怕是新手也能直接操作。

当我们提出一个准确地问题,需要高效地整合型的,直接获取答案,可以选择直接 " 问问豆包 ",进入到对话页面。

但有时候,我们也需要对现有的信息进行整理,来形成思考的链路,这时我们可以直接选择 AI 搜索,同时在 AI 搜索中,点击右上角「回原网页」便可以跳转回百度搜索页面。

但豆包电脑版浏览器功能并不是只为了构建浏览器本身,更重要的是,有了浏览器作为载体,浏览中可以更方便地调起 AI 协助。

比如在研究 AI 技术的过程中,创作者经常会查找和阅读许多论文,但外行看总是一个头两个大,对于很多名词的翻译和理解并不准确,豆包中配备学术搜索功能,在浏览中可随时划线 AI 搜索,翻译原文。

文字是搞懂了,但一涉及到图形演示或者数学问题,又犯了难。

在豆包电脑版浏览器功能中配备了「截图搜索」这一功能,在某一部分图像看不懂的时候,可以直接截图,使用豆包分析其中含义。

如果想快速高效地浏览一篇论文,也可以对网页进行总结,直接生成脑图,帮助我们快速了解论文里的复杂信息,同时可以针对网页内容进行音频播放,扩大使用场景。

除此之外,豆包还考虑到了,除了文字内容,创作者往往也需要大量浏览音频博客和视频一类更复杂的内容形式,豆包电脑版浏览器功能升级了理解图片和视频的视觉理解能力。

最近两周,整个科技圈都在跟进 OpenAI 的实时转播, 恨不得逐帧观看反复研究。通过豆包电脑版浏览器功能观看视频,能够理解和总结视频,甚至能够通过搜索关键词直接定位视频内容,就算落下了几天也不怕,在研究中也可以精准地搜索到 "Sam Altman 的原话 " 或者 " 关于 o1 有哪些更新 ",再也不必凭着记忆一帧一帧地找视频了。

搜索、浏览、翻译、整理总结,在全新的豆包电脑版浏览器功能里,查阅资料变成了一件更简单的事。更让编辑部感慨的是,相比于在 Chrome 里按一堆插件,豆包电脑版浏览器功能好像更懂 " 我 " 的需求,也更加便捷。

边写边查边改,不让电脑屏幕忙到冒烟

从前,搜索和撰写必须在不同的产品里,从网页里把有效信息提取出来,进行整理和加工。

这就导致了电脑屏幕往往被分成两块,或者安装多块屏。

而这不单单只是效率问题,两边复制粘贴,两个页面来回切换,经常会出现 bug 和格式错误,影响创作内容的准确性。

相信每一个创作者都经历过这样的 " 痛 "。在 AI 来了以后,本以为能提效的我们发现又更多了一个修改环节:查资料——大模型写初稿——复制粘贴在编辑器中——人工修改。

这个过程产生了一个更长的链条,中间无形的效率损耗非常大。

那么问题来了,能不能一边查一边生成,还能一边改?

豆包电脑版推出了「对话+编辑」一体的编辑器,页面形态与 ChatGPT Canvas 类似,但使用起来更符合创作者创作习惯,细化了产品功能,AI 生成和创作者修改有机的融合在一起,打开了一种新的人机写作方式。

硅星人提前内测了豆包的编辑器功能,在对话入口或帮我写作入口输入写作指令字数大于 300 字时便可自动触发编辑器,无缝丝滑切换到写作模式,在一个页面几乎能搞定所有难题。

左边是自由对话页面,在左侧对话框提出框架需求在右侧生成一份更详尽的框架,并通过多轮对话来完善框架内容,分点、分层次、清晰有序的展现文章的逻辑和结构。

在豆包生成初稿后,创作者可以对生成的内容进行二次创作和编排,在创作中,如果对某一段落不满意,可直接在对话中提出修改意见,进行局部的修改并在文中直接生成,不会像传统 AI 那样,重新生成一篇全新的文章,产生过量文字使得最终的写作效率降低。

左边提出需求,右侧为生成结果

当然,在编辑器中创作者也可以随时 AI 改写和自主修改,支持对全文或指定段落句子进行扩写 / 润色 / 缩写等 AI 改写功能,也可自定义提示词,仅修改目标段落或句子,进行自主替换。

比如第一段豆包的生成结果稍微口语化,我们需要更严肃的商业报道时,通过 Prompt 将其调整为更加书面的文本,并可以自由选择整段替换或部分替换,提高了编辑的灵活性。

我们发现,每一个需求豆包编辑器都能够生成一份独立的文档云端存储,方便后续找回。

最后,我们可以使用全文优化的功能,对刚刚分段修改后的文章的语言重新润色一遍,来保证文章的整体性和一致性。

图为全文润色后的生成结果

当超出了文章的范畴,比如写研报和论文,则需要更强的逻辑结构和关联性,豆包的分步骤写作功能,支持万字以上超长文本的写作,并支持三级标题,将复杂任务结构化拆解,创作者可以对大纲的每个部分进行细节修改,直到满意为止。

在分步骤写作中,AI 撰写也可以变得越来越 " 像你 ",将作者过往的作品发给豆包,豆包即可模仿语言风格和文章调性,进行更加个性化的生产。

这些表面上看似独立的能力,实际上都是在服务于同一个目标:确保生成内容的高度可用性。从辅助创作到直接生成可用的成果,AI 正在重塑人机交互的全新方式。

从产品形态来看,豆包编辑器与 10 月份 OpenAI 推出的 Canvas 编辑器的页面布局类似,二者都不约而同地选择了将「对话」和「编辑」功能集成的形态,构建一种全新的人机协作范式,来试图打开 AI 和人类共创的时代。

懂事的 AI 编辑器,连图都不用自己找

在图文创作过程中,图像是不可或缺的重要组成部分。但对于大多数文字工作者而言,虽然撰写文字内容相对容易,但寻找合适的图片素材往往望而生阻。

特别是在要求图片与上下文语境相符,且不涉及版权问题的情况下,寻找适合的素材更加艰难。

过去我们常常通过文生图工具进行二次创作,但这需要重新编写 Prompt,有时还会因为不熟悉专业术语而产生乱码,使得生成的图像根本无法用于文章之中。

懂事的豆包编辑器,连配图也能够联系上下文语义和对整篇文章的掌握,理解和生成更适合的插图内容,甚至不用提出 Prompt。

在编辑器中,直接点击➕,即可调用全网搜图或 AI 生图能力,甚至不用提出新的提示词,根据上下文语义,对于 " 灵感的创意工坊 " 这个比喻,生成了带有魔法的提示板。如果对于生成结果不满意,可重新生成新的图片。

当然,我们也可以在对话中直接提出新的提示词,来更准确的描述图片信息。如上图,豆包生成了 "AI 搜索:信息的高速公路 ",根据这个创意,我们提出了一个简单的图片构思,随机豆包的插图功能生成了四张插画风格的插图。

相信眼尖的你也注意到了,没错,在豆包电脑版中,也上新了此前 " 可控中文生成的能力 "。豆包精准的生成了带有信息字符的高速公路,甚至在 4 张图片中,分别放在了不同位置。

不过,对于以图像为主文字为辅的创作者来说,对于图片的二创往往是常态,比如下面这张图中,明显广告牌中出现了乱码,我们分别使用了 " 区域重绘 " 能力,提出了新的 Prompt,将广告牌变成了树," 擦除 " 和 " 扩图 " 三种不同的修改方式,对下图进行了实时编辑,最终保证可用的效果。

当然,基于图片和文字这两种比较基础的内容形态,据悉紧跟着豆包电脑版还将上线 PPT 生成能力,打工人的天菜能力终于要上线了!

另外,万众期待的视频生成的能力也在内测中了,刚刚 OpenAI 在 Canvas 中更新的代码能力,也可以小小的期待一下。

至此,豆包真的是集搜索、写稿、生图、视频为一身,不知道各位认为这次的挑战是否成功呢?

结尾:

新石器时代,人类首次将木斧、锥器、火石等工具集成到一起使用,孕育了有史以来第一次工具革命。如今,AI 驱动的 All in One 平台出现,将多种功能融为一体,为知识创作带来了深刻的变革。

不同于过去工具割裂的状态,All in One 平台正在重塑创作者的思维和创作方式,开启了全新的创作范式。创作者不再被工具所局限,反过来工具组也在重塑人类的认知方式。这不仅提高了创作效率,更重要的是催生了人机深度交互的创作模式。

从另一个角度来看,在一个 AI 爆发的新时代,用户都是 " 用脚投票 ",All in one 的背后也是用户在不同的场景下都愿意选择豆包的一种自然的结果。一方面,多模态的输入、多端的部署,让豆包在用户身边无所不在,问问豆包最快、最及时。

另一方面,问问豆包最 " 快 " 也不仅是速度上的,更是因为有效,用最简单、最直观的方式给出答案。不需要再花心思去翻书或者上网搜索,只需要提出问题,尤其在豆包电脑版集成了几乎所有能力后,真正做到了什么都问问豆包。

All in One 平台的无缝集成,标志着 AI 辅助创作向成熟阶段迈进。它汇集了人类智慧和 AI 能力,为知识生产力带来新的大规模提升。这不只是简单的功能集成,更是 AI 辅助走向成熟的必由之路。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 准确 chrome 百度
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论