當(dāng)前位置:首頁 > 工業(yè)控制 > 電路設(shè)計(jì)項(xiàng)目集錦
[導(dǎo)讀]曾經(jīng)希望使用DFRobot ESP32-S3 AI相機(jī)創(chuàng)建聲控ChatGPT嗎?這篇博客將指導(dǎo)你完成整個(gè)過程。我們將引導(dǎo)您完成以下步驟:通過內(nèi)置麥克風(fēng)收集用戶命令,將音頻保存為SD卡上的WAV文件,使用Deepgram API將音頻轉(zhuǎn)換為文本,查詢OpenAI的響應(yīng),并在串行終端中打印答案。

曾經(jīng)希望使用DFRobot ESP32-S3 AI相機(jī)創(chuàng)建聲控ChatGPT嗎?這篇博客將指導(dǎo)你完成整個(gè)過程。我們將引導(dǎo)您完成以下步驟:通過內(nèi)置麥克風(fēng)收集用戶命令,將音頻保存為SD卡上的WAV文件,使用Deepgram API將音頻轉(zhuǎn)換為文本,查詢OpenAI的響應(yīng),并在串行終端中打印答案。

組件要求:

?DFRobot ESP32-S3 AI攝像頭

?MicroSD卡

?USB電纜

?安裝Arduino IDE的計(jì)算機(jī)

ESP32-S3 AI CAM概述:

ESP32-S3 AI CAM是一款基于ESP32-S3芯片的高級攝像頭模塊,專為視頻圖像處理和語音交互而設(shè)計(jì)。它在視頻監(jiān)控、邊緣圖像識(shí)別和語音對話等人工智能項(xiàng)目中表現(xiàn)出色。該模塊具有廣角紅外攝像頭,可全天候監(jiān)控,即使在低光條件下也能確保清晰的圖像。

內(nèi)置麥克風(fēng)和揚(yáng)聲器,支持語音識(shí)別和對話,是智能家居和物聯(lián)網(wǎng)應(yīng)用的理想選擇。此外,它還可以通過Wi-Fi連接到互聯(lián)網(wǎng),通過云人工智能平臺(tái)實(shí)現(xiàn)圖像分類和自然語言對話等高級任務(wù)。

用Justway的3D打印服務(wù)開啟制造業(yè)的未來!

通過JUSTWAY的頂級3D打印服務(wù),體驗(yàn)創(chuàng)新和效率的頂峰。無論您是想創(chuàng)建詳細(xì)的原型,功能部件還是定制設(shè)計(jì),我們都能為您提供幫助。

JUSTWAY的尖端技術(shù),包括SLA, SLS, DLP, MJF, FDM和SLM,確保每一個(gè)打印的精度和質(zhì)量。從各種材料中選擇,如樹脂,尼龍,金屬等,讓您的視覺栩栩如生。

受益于即時(shí)報(bào)價(jià),無縫的在線訂單跟蹤,和專業(yè)的后處理服務(wù)。憑借快速的生產(chǎn)和可靠的交付,JUSTWAY是您所有3D打印需求的首選合作伙伴。

但是等等,還有更多!JUSTWAY還提供一系列其他一流的金屬3D打印服務(wù),以補(bǔ)充您的制造要求:

?數(shù)控加工服務(wù):高精度銑削,車削,電火花加工(EDM)復(fù)雜的零件。

?鈑金加工服務(wù):根據(jù)您的規(guī)格定制鈑金零件。

?注塑成型服務(wù):高品質(zhì),大批量生產(chǎn)各種材料的零件。

?表面精加工服務(wù):通過專業(yè)的精加工選擇,提高零件的外觀和耐用性。

通過justway提升您的制造游戲-創(chuàng)新與完美的結(jié)合!

如何在JUSTWAY為您的3D模型下訂單

訂購您的3D模型JUSTWAY是簡單的。首先以可接受的格式準(zhǔn)備您的3D CAD文件。訪問JUSTWAY網(wǎng)站,登錄或創(chuàng)建一個(gè)帳戶,并在“獲取即時(shí)報(bào)價(jià)”部分上傳您的設(shè)計(jì)。

選擇您的制造工藝,定制您的訂單與所需的材料和完成,并收到一個(gè)即時(shí)報(bào)價(jià)。確認(rèn)細(xì)節(jié),付款,并在線跟蹤您的訂單。

一旦您的訂單被放置,JUSTWAY將確保高質(zhì)量的生產(chǎn)與嚴(yán)格的質(zhì)量控制檢查。期望您的3D模型在指定的交貨期內(nèi)交付。使用JUSTWAY,享受將您的3D模型帶入生活的便利和效率!

項(xiàng)目流程:

我計(jì)劃使用OpenAI或DeepSeek支持創(chuàng)建一個(gè)語音助手,包括向ESP32 S3 AI相機(jī)提出一個(gè)問題。相機(jī)將通過其內(nèi)置的I2S PDM麥克風(fēng)捕捉我們的請求,然后將錄音保存到SD卡上

然后我們可以使用DeepGram將音頻轉(zhuǎn)換為文本,然后我們可以使用OpenRouter來獲得答案。

步驟1:設(shè)置硬件

將MicroSD卡插入ESP32-S3 AI攝像機(jī)。

步驟2:設(shè)置軟件

安裝Arduino IDE:從官方網(wǎng)站下載并安裝最新版本的Arduino IDE。

安裝所需庫:打開Arduino IDE,安裝以下庫:

?SD

?HTTPClient

?WiFiClientSecure

?ArduinoJson

要安裝這些庫,請轉(zhuǎn)到Sketch > Include Library > Manage libraries,搜索每個(gè)庫,然后單擊install

步驟3:收集音頻數(shù)據(jù)

初始化麥克風(fēng):使用以下代碼初始化內(nèi)置麥克風(fēng)和錄制音頻命令。

下面的草圖可以錄制5秒的音頻,然后它也會(huì)將其保存為。wav文件在SD卡上,它通過內(nèi)置揚(yáng)聲器播放音頻。

步驟4:使用Deepgram API將音頻轉(zhuǎn)換為文本

注冊Deepgram API:登錄Deepgram網(wǎng)站,然后,注冊一個(gè)API密鑰。

發(fā)送音頻文件到Deepgram:使用以下代碼將WAV文件發(fā)送到Deepgram API并將音頻轉(zhuǎn)換為文本。

在這個(gè)代碼部分,您只需要輸入您的音頻文件。它將使用Deepgram將WAV文件轉(zhuǎn)換為文本。

步驟5:查詢OpenAI的響應(yīng)

注冊O(shè)penAI API:訪問OpenRouter網(wǎng)站并注冊一個(gè)API密鑰。

發(fā)送文本到OpenAI:使用以下代碼發(fā)送文本到OpenAI API并打印響應(yīng)。

步驟6:整合一切

最終代碼:將前面的步驟合并到一個(gè)代碼庫中。

最后的輸出:

設(shè)置好所有內(nèi)容后,只需打開串行終端并查找響應(yīng)。

首先,它將連接到網(wǎng)絡(luò),然后它將錄制5秒的音頻。然后它會(huì)使用deepGram將音頻轉(zhuǎn)換為文本,然后它會(huì)向OpenAI或DeepSeek查詢。

演示:

根據(jù)我的測試,結(jié)果很快就出來了。我的下一個(gè)計(jì)劃是使用ESP32 S3的揚(yáng)聲器將響應(yīng)轉(zhuǎn)換為音頻輸出。

使用案例

?無障礙解決方案:開發(fā)先進(jìn)的人工智能助手,為身體殘疾的個(gè)人提供免提互動(dòng)。

?智能家居自動(dòng)化:通過語音命令控制家用電器,提高便利性

結(jié)論

恭喜你!您已經(jīng)使用OpenAI、DFRobot ESP32-S3 AI Camera和Deepgram API成功構(gòu)建了語音命令ChatGPT。本指南提供了一個(gè)全面的演練,以幫助您創(chuàng)建和定制您的聲控AI助手。編碼快樂!

您可以隨意嘗試并添加更多功能,不要猶豫,分享您的項(xiàng)目和經(jīng)驗(yàn)。如果您有任何問題或需要進(jìn)一步的幫助,請隨時(shí)提出!

本文編譯自hackster.io

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉