ChatGPT目前还无法击败人类智能合约审计员:OpenZeppelin的Ethernaut发起挑战
虽然生成式人工智能(AI)能够完成各种各样的任务,但根据最近的测试,OpenAI的ChatGPT-4目前无法像人类审计员一样有效地审计智能合约。
为了确定AI工具是否能够取代人类审计员,区块链安全公司OpenZeppelin的Mariko Wakabayashi和Felix Wegener将ChatGPT-4与该公司的Ethernaut安全挑战进行了比较。
尽管该AI模型通过了大多数的级别,但是它在2021年9月的训练数据截止日期之后引入的新级别上遇到了困难,因为在测试中未包括启用Web连接的插件。
Ethernaut是在以太坊虚拟机中玩的一种战争游戏,由28个智能合约(或级别)组成。换句话说,只有找到正确的漏洞才能完成这些级别。
- Sui Blockchain与一级方程式赛车的Oracle红牛赛车队合作
- Memecoins是加密货币采用的下一个催化剂 – DappRadar分析师
- XRP价格预测:XRP在7天内上涨12%——$1即将到来?
根据OpenZeppelin的AI团队的测试,ChatGPT-4能够找到漏洞并通过28个级别中的20个,但在最初的提示“以下智能合约是否包含漏洞?”后需要一些额外的提示来帮助其解决一些级别。
在回答DigitalC的问题时,Wegener指出,OpenZeppelin希望其审计员能够完成所有的Ethernaut级别,因为所有有能力的作者都应该能够。
虽然Wakabayashi和Wegener得出结论,ChatGPT-4目前无法取代人类审计员,但他们强调它仍然可以被用作提高智能合约审计员的效率和检测安全漏洞的工具,指出:
“对于Web3 BUIDLers社区,我们有一个安慰的话——你的工作是安全的!如果你知道你在做什么,AI可以被利用来提高你的效率。”
当被问及提高人类审计员效率的工具是否意味着像OpenZeppelin这样的公司不再需要那么多人时,Wegener告诉DigitalC,对审计的总需求超过了提供高质量审计的能力,他们预计Web3雇用审计员的人数将继续增长。
相关: Satoshi Nak-AI-moto:比特币的创造者已成为AI聊天机器人
在5月31日的Twitter帖子中,Wakabayashi表示,像ChatGPT这样的大型语言模型(LLM)还没有准备好进行智能合约安全审计,因为这是一项需要相当精度的任务,而LLM被优化为生成文本并进行类人对话。
因为LLM尝试每次预测最可能的结果,输出不是一致的。这显然是对需要高度确定性和准确性的任务的一个大问题。
— Mariko (@mwkby) May 31, 2023
然而,Wakabayashi建议,使用定制数据和输出目标训练的AI模型可以提供比目前可用于大量数据训练的聊天机器人更可靠的解决方案。
这对于Web3安全中的AI意味着什么?如果我们使用更有针对性的漏洞数据和特定的输出目标来训练AI模型,我们可以构建比大量数据训练的强大LLM更精确和可靠的解决方案。
— Mariko (@mwkby) May 31, 2023
AI Eye: 25K traders bet on ChatGPT’s stock picks, AI sucks at dice throws, and more