在DFRobot ESP32 S3相機(jī)上構(gòu)建DIY語音控制GPT系統(tǒng)

時(shí)間：2025-03-10 19:12:36

關(guān)鍵字： GPT系統(tǒng) ESP32 S3 OpenAI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]曾經(jīng)希望使用DFRobot ESP32-S3 AI相機(jī)創(chuàng)建聲控ChatGPT嗎?這篇博客將指導(dǎo)你完成整個(gè)過程。我們將引導(dǎo)您完成以下步驟：通過內(nèi)置麥克風(fēng)收集用戶命令，將音頻保存為SD卡上的WAV文件，使用Deepgram API將音頻轉(zhuǎn)換為文本，查詢OpenAI的響應(yīng)，并在串行終端中打印答案。

曾經(jīng)希望使用DFRobot ESP32-S3 AI相機(jī)創(chuàng)建聲控ChatGPT嗎?這篇博客將指導(dǎo)你完成整個(gè)過程。我們將引導(dǎo)您完成以下步驟：通過內(nèi)置麥克風(fēng)收集用戶命令，將音頻保存為SD卡上的WAV文件，使用Deepgram API將音頻轉(zhuǎn)換為文本，查詢OpenAI的響應(yīng)，并在串行終端中打印答案。

組件要求:

?DFRobot ESP32-S3 AI攝像頭

?MicroSD卡

?USB電纜

?安裝Arduino IDE的計(jì)算機(jī)

ESP32-S3 AI CAM概述：

ESP32-S3 AI CAM是一款基于ESP32-S3芯片的高級攝像頭模塊，專為視頻圖像處理和語音交互而設(shè)計(jì)。它在視頻監(jiān)控、邊緣圖像識(shí)別和語音對話等人工智能項(xiàng)目中表現(xiàn)出色。該模塊具有廣角紅外攝像頭，可全天候監(jiān)控，即使在低光條件下也能確保清晰的圖像。

內(nèi)置麥克風(fēng)和揚(yáng)聲器，支持語音識(shí)別和對話，是智能家居和物聯(lián)網(wǎng)應(yīng)用的理想選擇。此外，它還可以通過Wi-Fi連接到互聯(lián)網(wǎng)，通過云人工智能平臺(tái)實(shí)現(xiàn)圖像分類和自然語言對話等高級任務(wù)。

用Justway的3D打印服務(wù)開啟制造業(yè)的未來!

通過JUSTWAY的頂級3D打印服務(wù)，體驗(yàn)創(chuàng)新和效率的頂峰。無論您是想創(chuàng)建詳細(xì)的原型，功能部件還是定制設(shè)計(jì)，我們都能為您提供幫助。

JUSTWAY的尖端技術(shù)，包括SLA， SLS， DLP， MJF， FDM和SLM，確保每一個(gè)打印的精度和質(zhì)量。從各種材料中選擇，如樹脂，尼龍，金屬等，讓您的視覺栩栩如生。

受益于即時(shí)報(bào)價(jià)，無縫的在線訂單跟蹤，和專業(yè)的后處理服務(wù)。憑借快速的生產(chǎn)和可靠的交付，JUSTWAY是您所有3D打印需求的首選合作伙伴。

但是等等，還有更多!JUSTWAY還提供一系列其他一流的金屬3D打印服務(wù)，以補(bǔ)充您的制造要求：

?數(shù)控加工服務(wù)：高精度銑削，車削，電火花加工(EDM)復(fù)雜的零件。

?鈑金加工服務(wù)：根據(jù)您的規(guī)格定制鈑金零件。

?注塑成型服務(wù)：高品質(zhì)，大批量生產(chǎn)各種材料的零件。

?表面精加工服務(wù)：通過專業(yè)的精加工選擇，提高零件的外觀和耐用性。

通過justway提升您的制造游戲-創(chuàng)新與完美的結(jié)合!

如何在JUSTWAY為您的3D模型下訂單

訂購您的3D模型JUSTWAY是簡單的。首先以可接受的格式準(zhǔn)備您的3D CAD文件。訪問JUSTWAY網(wǎng)站，登錄或創(chuàng)建一個(gè)帳戶，并在“獲取即時(shí)報(bào)價(jià)”部分上傳您的設(shè)計(jì)。

選擇您的制造工藝，定制您的訂單與所需的材料和完成，并收到一個(gè)即時(shí)報(bào)價(jià)。確認(rèn)細(xì)節(jié)，付款，并在線跟蹤您的訂單。

一旦您的訂單被放置，JUSTWAY將確保高質(zhì)量的生產(chǎn)與嚴(yán)格的質(zhì)量控制檢查。期望您的3D模型在指定的交貨期內(nèi)交付。使用JUSTWAY，享受將您的3D模型帶入生活的便利和效率!

項(xiàng)目流程:

我計(jì)劃使用OpenAI或DeepSeek支持創(chuàng)建一個(gè)語音助手，包括向ESP32 S3 AI相機(jī)提出一個(gè)問題。相機(jī)將通過其內(nèi)置的I2S PDM麥克風(fēng)捕捉我們的請求，然后將錄音保存到SD卡上

然后我們可以使用DeepGram將音頻轉(zhuǎn)換為文本，然后我們可以使用OpenRouter來獲得答案。

步驟1：設(shè)置硬件

將MicroSD卡插入ESP32-S3 AI攝像機(jī)。

步驟2：設(shè)置軟件

安裝Arduino IDE：從官方網(wǎng)站下載并安裝最新版本的Arduino IDE。

安裝所需庫：打開Arduino IDE，安裝以下庫：

?SD

?HTTPClient

?WiFiClientSecure

?ArduinoJson

要安裝這些庫，請轉(zhuǎn)到Sketch > Include Library > Manage libraries，搜索每個(gè)庫，然后單擊install

步驟3：收集音頻數(shù)據(jù)

初始化麥克風(fēng)：使用以下代碼初始化內(nèi)置麥克風(fēng)和錄制音頻命令。

下面的草圖可以錄制5秒的音頻，然后它也會(huì)將其保存為。wav文件在SD卡上，它通過內(nèi)置揚(yáng)聲器播放音頻。

步驟4：使用Deepgram API將音頻轉(zhuǎn)換為文本

注冊Deepgram API：登錄Deepgram網(wǎng)站，然后，注冊一個(gè)API密鑰。

發(fā)送音頻文件到Deepgram：使用以下代碼將WAV文件發(fā)送到Deepgram API并將音頻轉(zhuǎn)換為文本。

在這個(gè)代碼部分，您只需要輸入您的音頻文件。它將使用Deepgram將WAV文件轉(zhuǎn)換為文本。

步驟5：查詢OpenAI的響應(yīng)

注冊O(shè)penAI API：訪問OpenRouter網(wǎng)站并注冊一個(gè)API密鑰。

發(fā)送文本到OpenAI：使用以下代碼發(fā)送文本到OpenAI API并打印響應(yīng)。

步驟6：整合一切

最終代碼：將前面的步驟合并到一個(gè)代碼庫中。

最后的輸出:

設(shè)置好所有內(nèi)容后，只需打開串行終端并查找響應(yīng)。

首先，它將連接到網(wǎng)絡(luò)，然后它將錄制5秒的音頻。然后它會(huì)使用deepGram將音頻轉(zhuǎn)換為文本，然后它會(huì)向OpenAI或DeepSeek查詢。

演示:

根據(jù)我的測試，結(jié)果很快就出來了。我的下一個(gè)計(jì)劃是使用ESP32 S3的揚(yáng)聲器將響應(yīng)轉(zhuǎn)換為音頻輸出。

使用案例

?無障礙解決方案：開發(fā)先進(jìn)的人工智能助手，為身體殘疾的個(gè)人提供免提互動(dòng)。

?智能家居自動(dòng)化：通過語音命令控制家用電器，提高便利性

結(jié)論

恭喜你!您已經(jīng)使用OpenAI、DFRobot ESP32-S3 AI Camera和Deepgram API成功構(gòu)建了語音命令ChatGPT。本指南提供了一個(gè)全面的演練，以幫助您創(chuàng)建和定制您的聲控AI助手。編碼快樂!

您可以隨意嘗試并添加更多功能，不要猶豫，分享您的項(xiàng)目和經(jīng)驗(yàn)。如果您有任何問題或需要進(jìn)一步的幫助，請隨時(shí)提出!

本文編譯自hackster.io

在DFRobot ESP32 S3相機(jī)上構(gòu)建DIY語音控制GPT系統(tǒng)

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場，使汽車開發(fā)時(shí)間和成本降低90%

從容應(yīng)對未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

中國通信服務(wù)公布2024年中期業(yè)績

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

軟通動(dòng)力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達(dá)成戰(zhàn)略合作，共同推動(dòng)新能源出行體驗(yàn)

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲(chǔ)等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會(huì)2025聚焦"營銷競?cè)?，打破市場?nèi)卷實(shí)現(xiàn)認(rèn)知進(jìn)化"

恒久動(dòng)力馳騁天地美孚1號(hào)攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗(yàn)

美通社母公司Cision發(fā)布CisionOne平臺(tái)，進(jìn)軍亞太地區(qū)媒體監(jiān)測市場

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計(jì)業(yè)績

華為發(fā)布AI百校計(jì)劃：培養(yǎng)AI人才每年獲最高100萬支持