當前位置:首頁 > 芯聞號 > 極客網
[導讀]事實表明,AI無法替代開發(fā)者,但更適用于優(yōu)秀的開發(fā)者。而識別大型語言模型(LLM)生成的代碼什么時候會出錯,需要開發(fā)人員具有豐富的知識和經驗。

事實表明,AI無法替代開發(fā)者,但更適用于優(yōu)秀的開發(fā)者。而識別大型語言模型(LLM)生成的代碼什么時候會出錯,需要開發(fā)人員具有豐富的知識和經驗。

軟件工程師David Showalter在談到AI編程時表示:“目前,AI模型在幫助編程人員提高工作效率方面表現(xiàn)出色?!蹦敲?,這一觀點是否站得住腳?Showalter的言論實則是對AI專家Santiago Valdarrama的回應——他認為大型語言模型(LLM)作為編碼助手目前還不完全可靠。Valdarrama說:“除非LLM給我們同樣的保證(就像編程語言一樣讓計算機始終響應命令),否則它們只能被視為華而不實的‘炫技’, 對多數(shù)應用程序的開發(fā)來說并無實際價值?!彼挠^點頗具見地,LLM在如何回應提示方面顯然是不一致的,即使是同一提示可能會得到截然不同的回應。因此,Showalter的看法可能過于樂觀:雖然AI模型在輔助開發(fā)人員編寫更多代碼方面有不俗的表現(xiàn),但這并不等同于能夠生成高質量的可用代碼。

AI和軟件開發(fā)成功的關鍵在于敏銳地識別那些潛在的不完善之處。許多開發(fā)人員并沒有意識到這一點,他們過于依賴LLM的輸出結果。正如計算機科學網站HackerNews的一位評論員所說,“我想知道的是,用戶對于ChatGPT的信任有多少是建立在那些看似完美無缺的示例之上的……尤其是對于特定類型的用戶來說?!睘榱四軌蛟谲浖_發(fā)中有效地使用AI,開發(fā)人員需要足夠的經驗判斷LLM的輸出什么時候可能不夠準確或存在誤導。

并沒有簡單的解決方案

關于LLM在軟件開發(fā)中的應用和表現(xiàn)存在不同的看法。正如HackerNews網站的一些評論所展示的那樣,許多開發(fā)人員并不贊同過度依賴LLM的輸出。他們反駁的理由通常歸結為:“當然,開發(fā)人員不能盲目地信任LLM的輸出,就像他們不會無條件地信任在Stack Overflow上找到的代碼,或者完全依賴集成開發(fā)環(huán)境(IDE)等工具一樣?!?

就目前而言,這種看法是正確的,但現(xiàn)實往往并不盡如人意。例如,雖然開發(fā)人員不應該完全相信他們使用的集成開發(fā)環(huán)境(IDE),但IDE在處理基本編程任務時具備一定程度的準確性和穩(wěn)定性,例如不會隨意“破壞”程序或弄亂Lisp括號。ChatGPT很可能會出錯,但是IDE很少出現(xiàn)這種情況。

對于堆棧溢出(Stack Overflow)上的代碼來說,可能有不同的使用方式。有些開發(fā)人員可能會直接復制粘貼代碼,而不進行檢查。但明智的開發(fā)人員則會采取更為審慎的態(tài)度。他們會首先查看有關代碼的評論,以評估其質量和適用性。

LLM的輸出并不包含這樣的信號。正如一位開發(fā)人員所建議的那樣,“將Stack Overflow和LLM的輸出都視為可能是錯誤的結果,并且可能是由經驗不足的開發(fā)人員編寫的代碼。”這是一種明智的做法。即使存在錯誤,這些代碼片段或建議也可能為提供有價值的啟示,幫助開發(fā)人員朝著正確的方向前進。

同樣,這需要開發(fā)人員具備足夠的經驗以識別Stack Overflow的代碼示例或LLM生成的代碼是否存在錯誤?;蛘唛_發(fā)人員足夠明智,只將這些代碼用在“200行樣板文件”或“React頁面中的大表”等常見的場景中。在這些場景中,可以不必完全信任這些代碼,只需在完成之后進行測試即可。

總之,正如一位開發(fā)人員所總結的那樣,“我對LLM的信任程度就像我對初級開發(fā)人員或實習生的信任一樣。我會給它分配一些我知道如何完成的任務,以此驗證其準確性,但不會在這些任務上花費過多的時間。這無疑是最佳的策略。從AI中獲益最大的開發(fā)人員是那些明智的人,他們知道LLM什么時候可能會出錯,但同時也能從中得到一些好處。”

尋求正確使用的方法

開源Python工具Datasette創(chuàng)始人Simon Wilison曾經提出這樣的觀點,“從AI中獲得最佳結果實際上需要大量的知識和經驗,因為很多都歸結于直覺?!彼ㄗh經驗豐富的開發(fā)人員測試不同LLM的局限性,以衡量它們的相對優(yōu)勢和劣勢,即便一些LLM模型表現(xiàn)不盡如人意,仍然可以利用其價值。

初級開發(fā)人員如何有效利用AI進行編程?AWS AI開發(fā)者體驗主管Doug Seven表示,像Amazon Q Developer(前身為CodeWhisperer)這樣的編碼助手,對經驗不足的開發(fā)人員同樣可以提供幫助。這些工具能夠為他們提供有價值的建議,幫助他們明確編程思路,從而減少編程過程中頻繁向他人求助的需求。

也許正確的答案是:取決于具體情況!

而且重要的是,軟件開發(fā)的理念通常不是“更快、更多地編寫代碼”。實際上,優(yōu)秀的開發(fā)人員編寫代碼的時間很少,而花費更多的時間思考需要解決的問題以及如何找到最佳解決方案。LLM可以在這方面提供幫助,正如Willison所指出的那樣:“ChatGPT(以及GitHub Copilot)為我節(jié)省了大量的‘深思熟慮’的時間。從在Bash中編寫For循環(huán)到記住如何在Javascript中進行跨域CORS請求,我甚至不需要再查找其他資料。”

聲明:該篇文章為本站原創(chuàng),未經授權不予轉載,侵權必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉