当 GPT-4向大家展示了如何用十秒把一个网站的手绘草图变成功能齐全的网站,包括一些炫酷的js链接按钮,技惊四座。不可避免地,前端工程师们也被 AI 风暴卷到了。
当我们把目光转向前端这个发展相对成熟的技术领域。去思考前端开发者们将如何被 AI 影响,是个有趣的问题还是令人心慌?
(资料图)
虽然有前端工程师理性表示:“几十年来,我们都不需要Web开发人员来构建这种类型的页面,这个 html 文档与当前前端开发人员编写的代码有着巨大的差异。”但众所周知这只是 GPT-4在早期的功能,如果继续发展下去,在几年内构建整个应用程序也并非不可能。
AI 为企业、前端开发者、行业带来哪些改变?开发者又该如何运用AI技术提升核心竞争力?CSDN 《开谈》栏目邀请到 TC39invited expert 贺师俊,DCloud 公司创始人王安,支付宝体验技术部前端工程师杨森,豆角编程创始人、O’reilly 技术评审(主持人)石川4位前端领域大咖为你聊透 AI 入侵前端的方方面面。
精彩观点抢先看:
▶ 以前我们常说一个顶尖的程序员效率可能是普通程序员的10倍,但在 AI 的加持下,差距可能是100倍。
▶人工智能生成的代码和图片版权归谁?目前似乎还没有清晰的定义,但我了解到有一种思路——看人类在整个创作过程中付出的努力。
▶如果 AI 的能力发展到能让许多产品和服务不再需要使用按钮和表单来与用户交互,而是采用对话框或其他形式,那么前端工程师可能真的会被替代。
▶库的更新速度非常快,目前 AI 的训练和精细模型不支持如此快速的更新,即使可以理解前端快速更新的“轮子”,它所生成的代码也可能是过时的。
▶AI 生成内容的安全与合规问题该如何解决?隐私计算或许是一条出路。
▶在 AI 时代会让整体都变得更平均。让一小部分人掌握新技术变得超级强大,但对于其他人来说,可能会变得更加平均。
人类面对 AI 的三大派别
石川:在刘慈欣的科幻小说《三体》中地球三体组织分为三个派别:降临派、拯救派和幸存派,分别代表人类面对三体人的不同态度。不同的前端开发者在面对人工智能时也展现不同的态度,有人简单将其归纳为:AI 降临派——AI 会为人类所用,被人类驾驭;AI 拯救派——AI 可以与人类友好相处,帮助人类更好地发展;AI 幸存派——AI 最终会统治人类,在使唤 AI 时要说“请”。你更倾向于哪一派?
贺师俊:我比较倾向于幸存派,与人工智能友好相处的立场。虽然这个立场有点悲观,我们有个微信群,在这里我们有一个名为 ChatGPT 的机器人,好几个群友都是幸存派,他们对 ChatGPT 提问也是以“请问”开头。当谈到 ChatGPT 的时候,都会用“祂”来代替,我们将人工智能视为未来的神。我更倾向于幸存派的立场。ChatGPT 真的很像人,只是现在还像个小孩子,小孩子很难分辨虚假和真实。现在的 ChatGPT 可以看作是人类的儿童阶段。想想祂到了成人阶段会变得多么可怕,因为祂已学会了很多技能。
王安:我倾向于 AI 降临派,因为我已经研究 AI 很长时间,虽然很多学者提议暂停六个月,但我认为这些都无法阻挡 AI 的发展。我仍然欢迎世界能够更高效和快速地发展,支持和鼓励大家使用 AI 技术,以降低成本、提高效率和扩展能力。
ChatGPT 的知识体量远超任何一个人,但是学习能力在人脑模拟方面还有待提高。如果某一天,AI 智商真的强过人类万倍,那么人类确实不配再成为地球的主宰。但现在还未到奇点,如果你对人工智能的能力边界有更清晰的认识,焦虑就会相对减少,现在的 AI 水平确实只能做副驾驶。
杨森:我可能更倾向于 AI 拯救派。无论 AI 的能力如何发展(无论是算力还是参数规模),AI 可能长期扮演人类助理的角色,从各大公司推出的 AI 产品可以看出。即使有一天 AI 技术达到顶峰,它也可能无法取代人类在现代工业社会中的某些不可或缺的作用和地位。因此,我认为 AI 可能会很长一段时间作为人类的聪明、实用、耐心的助手,但不会完全取代人类或者做类似的事情。
AI 入侵前端降本增效了吗?
石川:在 GPT-4发布的官方演示中,它可以识别手绘网页草图,并仅用10秒钟左右根据草图写出网站代码。从专业角度来看这靠谱吗,生成的网站质量如何?
杨森:发布会的视频显示 GPT-4目前只能生android成一个 demo,时长只有10秒钟,但它的能力是显而易见的,它能通过多种方式将草图转化为代码,这确实是突破。但看最终生成的代码,其质量或真正应用的标准还有很长的路要走。
这个技术已有先例,前几年很火热的 Design-to-Code(从设计到代码)领域,可以生成设计稿的代码。当时设计稿相对比较规范,但是生成的代码不管是可用性、可操作性还是二次编辑性都存在很大的差距。这不仅仅是AI的问题,还涉及底层的组件库,它需要的是AI所理解的、高质量、耐用的组件库,这些因素都可能制约真正意义上的网站构建。目前来看,我们只能达到扫图带演示的水平。
对发布会上的演示我不会感到惶恐,反而感到兴奋。从微观角度来说,它提高了我的开发体验和知识获取体验。从长远来看,在真正能够取代人类工作的那一刻,AI 将会引发激烈的全社会、全世界关于伦理道德的讨论,即如何定位、限制和监管 AI 等等。如果有人因此感到焦虑,不用太担心,先去学习和了解,静观其变。
王安:我仔细分析发布会的视频,发现这并不完全正确。虽然在 GPT-4的演示中画了一个草图然后直接转换成 Code,但实际上商业场景不是这么用的。应该是草图先被AI转成精修图,生成很多张,然后在其中选一张继续生成代码。但由于前端“轮子”和插件在不断更新迭代,生成代码也会存在极大的过时问题。比如花了一个登录页面的草图,转成代码,其实在uni-app 体系中有一个库叫 uni-id,登录注册以及配套后台都写好了。如果只是生成一个登录界面的代码,不引用uni-id,那开发效率其实是下降了。目前ChatGPT 还不能有效生成引用 uni-id 的代码。实际上库的更新速度非常快,目前AI 的训练和精调模型不支持如此快速的更新学习。要知道GPT 的中间的P,是预训练的意思,它无法实时学习。除非将来微调和训练的成本有实质性的变化,才有可能让生成式AI实时学习新的“轮子”。尽管其他公司(包括我们)正在尝试,但不能确定能否成功。
面对 AI 带来的变化,社会管理层的焦虑程度比老百姓更高。它影响的不仅仅是前端职业,还有整个社会。作为普通人其实不必替社会管理者操心。如果你能力够强,懂算法,直接去看论文学习它;如果不足,那就使用别人做好的API 并研究怎么结合你的需求落地。我们发布了uni-AI 的库,前端开发者可以通过 js 调用 AI 能力,不用搞 python。不妨亲自去感受 AI 的能力,并思考如何在工作和生活中用其发挥更大的价值。
贺师俊:关于 GPT-410秒生成网站的问题只是一个附带演示,而不是用于提高效率,至少目前来说不高效,我理解他们演示的目的是为了炫耀技术,单一的原始模型现在可以很多用途,这个真的很厉害。虽然从专业角度来看,它生成的网站的意义可能不是非常大,但从它所展示的潜力来看,非常可怕。
石川 : 以现有技术为例,github 发布的 Copilot 可以简单地通过一些方法或者命名的函数,生成相应的函数,这类功能在降低成本和提高效率方面有多大的空间?
王安:目前我们与其他AI合作伙伴联合研发 IDE 的智能提示。目前感觉它对生产力在实际项目场景中的帮助并不大。因为它能帮你有效生成一些固定的代码,但在生成实际工程项目中的代码时,比如冒泡排序或正则式表达,由于对新库和 Uni-app 的不熟悉,效果不尽如人意。另外 token 的数量限制使得AI无法扫描整个工程,也影响它的实用性。不过它在写注释方面的助力非常好。这个功能很受我们内部的工程师欢迎,但其写代码方面实际运用率不到20%。这也是很多人不想尝试的原因。要想提高生产力,业界还需要做很多努力。
杨森:可以看一个有意思的指标,那就是 Stack Overflow 的流量是否下降。我认为 Stack Overflow 解决了一些奇怪的报错或新库使用的问题,这让编程变得更加高效方便。许多新手可能已不需要再去查那些经常出现的基本错误。
贺师俊:具体情况具体分析。如果考虑提高效率,需要看具体条件。比如,我使用的是特定的库,而现在的 GPT-4或者其他工具可能不熟悉这个库,帮助会受到限制。但如果没有这些限制,虽然不能完全完成任务,但肯定会提高效率,因为人从头开始学习需要花费很多时间。
石川:AI 对前端行业的就业前景、薪资问题和技能要求等是否会有影响?
杨森:我觉得不仅仅是前端,所有工程师未来都可能需要学习一些基础的 Prompt 技巧。不仅在写代码的时候用得上,整理文字材料和日常工作中也会用到。AI 是一个随处可见、随处可用的助理,人们离不开它。怎样与它更好地交流?怎样让它更好地理解你,这可能是所有工程师、甚至所有职场人士都需要掌握的必备技能。
石川:行业标准的形成是各方利益博弈的结果,在未来的标准制定过程中,人工智能是否也会参与?
贺师俊:目前我所参与的标准组织 T39和 W3C 还没有看到将AI直接纳入考虑范畴,比如在制定标准时考虑使用者是人或是AI,可能需要一段时间。在标准制定的过程中,现在的 GPT 可能会有所帮助。比如在设计过程中需要查阅大量文档和会议记录来理解先前特性的设计原因,这需要耗费大量时间和精力。相比之下,使用针对特定场景进行优化设计的语言模型,例如 GPT,可能会提供更好的解决方案。
产权与安全问题仍充满争议
石川:代码著作权、安全性和产权问题也是大家比较关心的事情。如果我们使用AI 工具来开发代码,那么它属于谁?
杨森:这里其实是两个问题,一个是数据合规。大公司可能会遇到限制和要求,不允许将公司内部资料和代码外传。因此,使用 ChatGPT 代码的上下文就会被作为入参传给 API,这将违反公司的基本安全要求和规定,是公司明确不能接受的。
另一个问题是产生的代码反而引起了争议。人工智能生成的代码和图片版权归谁?目前似乎还没有清晰的定义,但我了解到有一种思路——看人类在整个创作过程中付出的努力。比如输入的词是自己想出来的,生成的图片著作权应归于人类。反过来,如果输入的是简单的词汇或直接抄袭别人的,生成的图片可能会因神经网络而有所不同,但著作权就不归属于个人。看人类参与的程度如何决定著作权问题。
贺师俊:我感觉很难界定。代码问题相对较小,但生成的图画涉及的著作权纠纷非常严重。它利用现有的插画师和针对特定风格的训练模型,严重侵犯了插画师的利益。这里的著作权问题还没有解决,更别说代码了。前端的大部分代码都是公开的,因此我们对其并不是很关注。在这种情况下,我们需要重视著作权和归属问题,这些问题没有确定的答案,也没有得到很好的关注。
王安:我注意到一些情况,在美国那边已经广泛应用 AI 能力了,这造成了很多社会影响。在那边的处理方式基本上是这样的:AI 直接生成的东西是没有版权的,但是你可以进行加工修改。你可以使用 AI 写作,但必须说明你在文章中改动了哪些、补充了哪些内容,都必须通过修订的方式体现出来。AI 生成的图片也没有版权,但如果你的 Prompt 很复杂,可以申请版权,只要它们具有独创性。
贺师俊:在我国这个问题挑战非常大。可以考虑美国是否有相关的判例,如果有,他们可能会建立新的准则。但是它们是在 GPT 出现之前,中国也有一些先例,有些个案认为AI所做的图片受到著作权保护,尽管是AI做的,但人付出了更多的劳动。在法律实践中这是非常困难的。
石川: 某些平台允许开发者在使用 GPT 时进行反馈,一些则不允许。在未来,是否应该给用户选择是否将生成的内容反馈给该平台?安全和合规问题该引起重视,又该如何解决?
杨森:如果作为一个提供融合 AI 能力产品的供应商,提供这样的选项给用户非常重要。但如果你是一名企业内部员工使用 AI 工具,当你的代码通过公共 API 发送到连接互联网的服务端时,这理论上都违反了公司的保密协议。
另一条思路或许能解决这个问题,那就是隐私计算。如果大家担心将自己行业的垂直数据交给 AI 背后的公司进行训练或预测,隐私计算就可能会成为一种选择。通过非对称加密或其他方式,确保数据被发送给 AI 公司,实际上他们并不知道具体内容。对于隐私计算领域来说,这可能是一个新的挑战。在传统的隐私计算中,更多是解决客户信息共享或数据要素交换的问题。但在处理 AI 数据方面,隐私计算如何发挥作用,可能还没有完整的解决方案。但我认为,这可能是一种可行的选择。对大公司来说,既要顾及自身的数据、隐私和安全问题,又不得不使用公共 AI 服务,进退两难。
AI 加剧平均化还是两极分化?
石川:技术升级让人与人之间的差距变得更明显了,前端程序员之间的技能差距会加大吗?
王安:科技的赋能会让少数掌握科技的人变得更强,其他人变得更平均。历史上有几次大的技术升级,原本做线下销售的硬件公司比如 IBM,非常强大。但在互联网时代,谷歌更好地利用了科技杠杆,成为更有实力的公司,服务更多的客户,挣更多的钱。在 AI 时代也是如此,能真正掌握新技术的企业会拥有比前辈们更高市值的机会。
AI 时代会让一小部分人掌握新技术变得超级强大,但对于其他人来说,可能会变得更加平均。大家探讨的社会学问题,比如未来可能会成为图钉型社会。现在是纺锤形,中间有很多中产阶级,上面有一些精英。但是如果 AI 变得非常强大,它可能造成一小部分控制AI的人在顶端,剩下的人平等地分布在一个平面上。
贺师俊:一方面,我觉得 AI 会使得很多事情更加平等,例如学习,AI 可以更好地帮助你学习并减少障碍;另一方面,AI 也可能放大不同人的能力差距。以前我们常说一个顶尖的程序员效率可能是普通程序员的10倍,但是在 AI 的加持下,差距可能是100倍。即使AI可能带来很多新机会,在现有的需求不javascript变的情况下,有 AI 的加持可能只需要更少的人去完成需求。我担心这件事会让整个就业市场更不稳定,如果行业不景气,就可能会有更多的人失业。
石川:在js这次的革新中,哪类程序员会面临危险?
贺师俊:有人问前端和后端哪个更容易被替代?实际上这并不是按照这样来区分,而是取决于你所从事的工作。比如前端,如果你现在从事的工作就是将一个设计图转化为网页这样相对简单的工作,那你确实是比较危险的。对于后端也是一样,虽然 GPT 没有演示,如果你只会基本的 CRUD,那也很危险。这些风险本就存在,AI 只是加速了它的出现。
杨森:现在来看,前端工程师是否会被取代还需要进一步讨论。在传统的 PC 端、中后台应用、小程序等领域,只要存在传统的 UI 界面,前端工程师就不太可能被替代。他们可能需要思考如何更好地利用 AI 助手。但是其中的变量因素是,如果 AI 的能力发展到能让许多产品和服务不再需要使用按钮和表单来与用户交互,而是采用对话框或其他形式,那么前端工程师可能真的会被替代。我期待这一点会实现。但是我认为,用户界面发生变化不是需要担心的事情。需要担心的是,AI 的结合可能会导致产业需求的急剧下降,这是比较可怕的地方。
王安:我认为目前不需要太担心被替代的问题,因为基础尚未被突破。需要关注的是Touch UI 向 LUI 的转变。这有点类似于移动互联网初出现时,人们需要考虑前端工程师需要进行转型,以此应对电脑和手机交互方式的差异。现在需要考虑 LUI,也就是基于自然语言的界面交互方式。
爱学习的人会加大与不爱学习者之间的差距。作为一名前端工程师,当你的公司引入 AI 能力时,你无法掌握这些技能,你的工作价值会被削弱。同时,如果不掌握这些技能,后端工程师将获得更高的薪资。因此,你需要学习如何有效地输出AI指令,例如 Prompt。总的来说,机会很多,只要你是一个热爱学习的人,你就永远会有机会。