推薦清單:圖像識(shí)別、機(jī)器學(xué)習(xí)和預(yù)測(cè)等有關(guān)的50多個(gè)API
雷鋒網(wǎng) AI 研習(xí)社按:本文由來(lái)自倫敦的數(shù)據(jù)科學(xué)家 Pedro Lopez 編寫(xiě),文中提供了與人臉識(shí)別、圖像識(shí)別、文本分析、自然語(yǔ)言處理、情緒分析、語(yǔ)言翻譯、機(jī)器學(xué)習(xí)和預(yù)測(cè)有關(guān)的 50 多個(gè)應(yīng)用程序接口(API),雷鋒網(wǎng) AI 研習(xí)社根據(jù)原文進(jìn)行了編譯。
本篇基于 2017 年的推薦清單做了一些改進(jìn)——去除了一些不再進(jìn)行維護(hù)的 API,并且更新了一些新的 API。主要覆蓋如下方向:
人臉與圖像識(shí)別
文本分析、自然語(yǔ)言處理、情感分析
語(yǔ)言翻譯
機(jī)器學(xué)習(xí)和預(yù)測(cè)
該清單按照字母排序,對(duì) API 的概述是基于對(duì)應(yīng)官網(wǎng)所提供的信息(截止 2018 年 4 月 16 日)整合而成。要是大家發(fā)現(xiàn)該清單中錯(cuò)過(guò)了某些當(dāng)前流行的 API,可以在評(píng)論中告知。
人臉與圖像識(shí)別
Animetrics Face RecogniTIon:可用于檢測(cè)圖像中的人臉,支持同時(shí)多人檢測(cè),并且可以將檢測(cè)到的人臉與已知的人臉數(shù)據(jù)進(jìn)行匹配。這個(gè) API 還可以添加或刪除可檢索圖庫(kù)中的主題,也可添加或刪除主題中的人臉。
Betaface:提供在線人臉識(shí)別和檢測(cè)服務(wù)。主要有如下功能:多人臉檢測(cè)、人臉裁剪、123 個(gè)人臉關(guān)鍵點(diǎn)檢測(cè)(22 個(gè)基本關(guān)鍵點(diǎn),101 個(gè)高級(jí)關(guān)鍵點(diǎn))、人臉驗(yàn)證、人臉識(shí)別以及大型數(shù)據(jù)庫(kù)中相似人臉的檢索。
Eyedea RecogniTIon:專(zhuān)注于高端計(jì)算機(jī)視覺(jué)解決方案,主要針對(duì)物體檢測(cè)和物體識(shí)別軟件開(kāi)發(fā)。提供眼睛、面部、車(chē)輛、版權(quán)和牌照識(shí)別等服務(wù)。這一 API 的主要價(jià)值是可以即時(shí)理解畫(huà)面中的對(duì)象、用戶(hù)和行為。
Face++:在應(yīng)用中提供人臉識(shí)別和檢測(cè)服務(wù),具有檢測(cè)、識(shí)別和分析服務(wù)功能。用戶(hù)可以調(diào)用訓(xùn)練程序、檢測(cè)人臉、識(shí)別人臉、人臉聚類(lèi)、操縱人臉、創(chuàng)建人臉數(shù)據(jù)集、創(chuàng)建分組和獲取信息。
FaceMark:該 API 可以從一張正面的人臉圖像中檢測(cè)出 68 個(gè)關(guān)鍵點(diǎn),從一張側(cè)面的人臉圖像中則可以檢測(cè)出 35 個(gè)點(diǎn)。
FaceRect:這是一個(gè)強(qiáng)大且完全免費(fèi)的人臉檢測(cè) API。該 API 能夠從單張圖像中找到單張人臉或者多張人臉(不論是正臉還是側(cè)臉),然后將找到的每個(gè)人臉信息存儲(chǔ)在生成的 JSON 文件中。此外,F(xiàn)aceRect 還能為每個(gè)檢測(cè)到的人臉找到面部特征(眼睛、鼻子和嘴巴等)。
Google Cloud Vision API:由諸如 TensorFlow 這樣的平臺(tái)作為支撐,該 API 允許模型學(xué)習(xí)和預(yù)測(cè)圖像中的內(nèi)容。它能幫助你在大規(guī)模數(shù)據(jù)集中快速找到你最喜歡的圖像,并獲得豐富的圖像信息。它將圖像劃分成幾千個(gè)類(lèi)別(例如“船”、“獅子”、“埃菲爾鐵塔”等),檢測(cè)人臉并分析情緒,識(shí)別圖像中的多國(guó)文字。
IBM Watson Visual RecogniTIon:該 API 可以理解圖像的內(nèi)容、視覺(jué)概念,然后在圖像中標(biāo)記出來(lái),檢測(cè)人臉、估計(jì)年齡和性別,從數(shù)據(jù)集中找到相似的圖像。你還可以通過(guò)創(chuàng)建自定義概念來(lái)訓(xùn)練服務(wù)器。
Imagga:該 API 可以自動(dòng)將標(biāo)簽分配給圖像,從而使得圖像檢索起來(lái)更加簡(jiǎn)單。它基于圖像識(shí)別平臺(tái)即服務(wù)(Platform as a Service)構(gòu)建。
Kairos:這個(gè)平臺(tái)可以幫你快速將情緒分析和人臉識(shí)別添加到應(yīng)用程序(APP)和服務(wù)中。
Microsoft CogniTIve Service - Computer Vision:這個(gè)云端 API 可以根據(jù)輸入數(shù)據(jù)和用戶(hù)的選擇,通過(guò)不同的方式分析視覺(jué)內(nèi)容。比如依據(jù)圖像內(nèi)容給圖像打標(biāo)簽、圖像分類(lèi)、檢測(cè)人臉并返回人臉坐標(biāo)、識(shí)別特定領(lǐng)域的內(nèi)容、生成與圖像內(nèi)容有關(guān)的描述、辨識(shí)圖像中的文本、標(biāo)記成人內(nèi)容。
ParallelDots Visual Analytics APIs:它提供特別服務(wù)來(lái)幫助進(jìn)行圖像自動(dòng)標(biāo)注,可以過(guò)濾不合適的內(nèi)容,從臉部表情中識(shí)別人物情緒。
Skybiometry Face Detection and Recognition:提供人臉檢測(cè)和識(shí)別服務(wù)。最新版本的 API 還可以區(qū)分墨鏡與一般眼鏡。
文本分析、自然語(yǔ)言處理與情感分析
Bitext:提供了市面上最準(zhǔn)確的基于多語(yǔ)言話題的情緒分析服務(wù)。目前,有四種語(yǔ)義服務(wù)可用:實(shí)體和概念提取,情感分析和文本分類(lèi)。該 API 支持 8 種主流語(yǔ)言。
Diffbot Analyze:為開(kāi)發(fā)者提供了許多工具,支持從任意的網(wǎng)頁(yè)中識(shí)別、分析和提取出主要內(nèi)容和部分。
Free Natural Language Processing Service:這是一項(xiàng)免費(fèi)服務(wù),包括情緒分析、內(nèi)容提取和語(yǔ)言檢測(cè)。這個(gè) API 在大型云 API 市場(chǎng) mashape.com 上非常流行。
Google Cloud Natural Language API:分析文本的結(jié)構(gòu)和意義,包括情緒分析、實(shí)體識(shí)別和文本注釋。
Watson Natural Language Understanding:分析文本并從內(nèi)容中抽取元數(shù)據(jù),例如概念、實(shí)體、關(guān)鍵詞、類(lèi)別、關(guān)系和語(yǔ)義信息。
MeaningCloud Text Classification:該 API 可以執(zhí)行預(yù)分類(lèi)任務(wù)(Pre-classification),例如文本抽取、符號(hào)化、停止詞消除和詞形還原。
Microsoft Cognitive Service - Text Analytics:從所給的文本中檢測(cè)情緒、關(guān)鍵短語(yǔ)、主題以及語(yǔ)言。還有一些 API(語(yǔ)言的認(rèn)知服務(wù))與該 API 類(lèi)似,包括:必應(yīng)拼寫(xiě)檢查、語(yǔ)言理解、語(yǔ)言分析、網(wǎng)絡(luò)語(yǔ)句模型。
nlpTools:一種簡(jiǎn)單的基于 HTTP RESTful 網(wǎng)絡(luò)服務(wù)的自然語(yǔ)言處理 API,反饋結(jié)果是 JSON。它可以解碼在線新聞媒體,進(jìn)行情緒分析和文本分類(lèi)。
Geneea:能夠在用戶(hù)提供的原始文本上進(jìn)行分析(自然語(yǔ)言處理),也能執(zhí)行分析從指定的 URL 中提取的文本、直接提供的文件。
ParallelDots Text Analytics APIs:支持十四種語(yǔ)言,提供方便且多樣化的自然語(yǔ)言理解(NLU)算法,可以檢測(cè)文檔的情感,查找文檔中的重要實(shí)體,刪除不文明用語(yǔ)。利用 ParallelDots 自定義分類(lèi)器,不需要任何訓(xùn)練數(shù)據(jù)就能構(gòu)建文本分類(lèi)器。
Thomson Reuters Open Calais:通過(guò)使用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和其它方法,Calais 可以將文檔與實(shí)體(人物、地點(diǎn)、組織等)、事實(shí)(人物“x”供職于公司"y")和事件(人物"z"在日期“x”被任命為公司“y”的主席)進(jìn)行分類(lèi)與連接。
Yactraq Speech2Topics:這是一個(gè)通過(guò)語(yǔ)音識(shí)別和自然語(yǔ)言處理將音頻和視頻內(nèi)容轉(zhuǎn)換為主題元數(shù)據(jù)的 API 。
語(yǔ)言翻譯
Google Cloud Translation:能夠在數(shù)以千計(jì)的語(yǔ)言對(duì)(Language pairs)中動(dòng)態(tài)翻譯文本,允許網(wǎng)站和程序以編程的方式與翻譯服務(wù)進(jìn)行集成。
Google Cloud SPEECH-TO-TEXT:應(yīng)用強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,開(kāi)發(fā)人員能夠利用該 API 將音頻轉(zhuǎn)化為文本。支持識(shí)別全球 120 種語(yǔ)言及其變體。
IBM Watson Language Translator:文本翻譯 API ,提供了多種特定領(lǐng)域的模型,你甚至能夠基于自己獨(dú)特的術(shù)語(yǔ)和語(yǔ)言進(jìn)行定制。例如,顧客們可以通過(guò)自己的語(yǔ)言進(jìn)行交流。
MotaWord:快速人工翻譯平臺(tái),提供超過(guò) 70 種語(yǔ)言的翻譯服務(wù)。該 API 還可以為開(kāi)發(fā)者們提供翻譯引用、翻譯項(xiàng)目提交、文檔和樣式指南功能,也可以跟蹤翻譯項(xiàng)目的進(jìn)度并實(shí)時(shí)獲取活動(dòng)反饋。
WritePath Translation:該 API 允許開(kāi)發(fā)人員訪問(wèn)和集成 WritePath 與其它應(yīng)用程序的功能??梢允褂么?API 完成的操作:檢索單詞數(shù)量、發(fā)布翻譯文檔、檢索已翻譯的文檔和文本。
Houndify:通過(guò)一個(gè)始終在學(xué)習(xí)的獨(dú)立平臺(tái),將智能語(yǔ)音和智能對(duì)話集成到產(chǎn)品中。
IBM Watson Conversation:構(gòu)建理解自然語(yǔ)言的聊天機(jī)器人,并將它們部署在任意設(shè)備上,比如信息平臺(tái)和網(wǎng)站。與此 API 相同的其它 API(語(yǔ)言的認(rèn)知服務(wù))包括:對(duì)話(Dialog)、自然語(yǔ)言分類(lèi)(Natural Language Classifier)、個(gè)性觀點(diǎn)(Personality Insights)、文件轉(zhuǎn)換(Documen Conversion)和聲調(diào)分析器(Tone Analyzer)。
IBM Watson Speech:包括語(yǔ)音到文本的轉(zhuǎn)換和文本到語(yǔ)音的轉(zhuǎn)換,例如在聯(lián)絡(luò)中心錄制電話或創(chuàng)建語(yǔ)音控制的應(yīng)用程序。
機(jī)器學(xué)習(xí)與預(yù)測(cè)
Amazon Machine Learning:可以進(jìn)行謊話檢測(cè)、天氣預(yù)報(bào)、目標(biāo)市場(chǎng)預(yù)測(cè)和點(diǎn)擊量預(yù)測(cè)。
BigML:為云托管的機(jī)器學(xué)習(xí)和數(shù)據(jù)分析提供服務(wù)。用戶(hù)可以設(shè)置數(shù)據(jù)源并創(chuàng)建一個(gè)模型,然后通過(guò)標(biāo)準(zhǔn)的 HTTP 協(xié)議使用基礎(chǔ)監(jiān)督和無(wú)監(jiān)督機(jī)器學(xué)習(xí)任務(wù)進(jìn)行預(yù)測(cè)。
Google Cloud Prediction:提供一種基于 RESTful API 來(lái)構(gòu)建機(jī)器學(xué)習(xí)模型的服務(wù)。這些工具可以幫助分析數(shù)據(jù),從而為你的應(yīng)用提供多種多樣的新功能,例如,客戶(hù)情感分析、垃圾郵件檢測(cè)、推薦系統(tǒng)等等。
co:為電商網(wǎng)站提供產(chǎn)品推薦引擎。Guesswork 使用在 Google Prediction API 上運(yùn)行的語(yǔ)義規(guī)則引擎可以準(zhǔn)確預(yù)測(cè)客戶(hù)意圖。
Hu:toma:提供免費(fèi)訪問(wèn),幫助全世界的開(kāi)發(fā)人員構(gòu)建并實(shí)現(xiàn)深度學(xué)習(xí)聊天機(jī)器人,提供創(chuàng)建和分享對(duì)話式 AI 的工具和渠道。
IBM Watson Retrieve and Rank:開(kāi)發(fā)人員可以將他們的數(shù)據(jù)加載到這一服務(wù)中,使用已知的結(jié)果來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型(Rank),之后將輸出相關(guān)文檔和元數(shù)據(jù)的列表等。利用這一 API,可以幫助呼叫中心智能體快速找到答案,以改善客戶(hù)呼叫的平均處理時(shí)間。
indico:提供文本分析(例如情感分析、Twitter 預(yù)約、情感)和圖像分析(例如面部情緒、面部定位)功能。indico 的 API 可以免費(fèi)使用,不需要訓(xùn)練數(shù)據(jù)。
Microsoft Azure Cognitive Service API:支持批處理,擁有更好的 API Explorer,更簡(jiǎn)潔的 API 接口,更一致的注冊(cè)/計(jì)費(fèi)體驗(yàn)等新功能。
Microsoft Azure Anomaly Detection API:用數(shù)值(均勻時(shí)間間隔)檢測(cè)時(shí)間序列數(shù)據(jù)中的異常情況。例如,當(dāng)檢測(cè)到計(jì)算機(jī)內(nèi)存使用量開(kāi)始上升時(shí),可能會(huì)指示內(nèi)存泄露。
Microsoft Cognitive Service - QnA Maker:將信息提取成會(huì)話形式。與該 API 同一個(gè)組(知識(shí)的認(rèn)知服務(wù))的有如下 API:學(xué)術(shù)知識(shí)(Academic Knowledge)、實(shí)體鏈接(Entity Linking)、知識(shí)探索(Knowledge Exploration)和推薦(Recommendations)。
Microsoft Cognitive Service - Speaker Recognition:能讓你的應(yīng)用程序理解誰(shuí)正在說(shuō)話。與該 API 位于同一個(gè)組(語(yǔ)音的認(rèn)知服務(wù))的其它 API 有必應(yīng)語(yǔ)音(將語(yǔ)音轉(zhuǎn)換為文本,然后再將文本轉(zhuǎn)換為語(yǔ)音,并且還能理解語(yǔ)音隱含的意圖)和自定義識(shí)別。
MLJAR:為原型設(shè)計(jì)、開(kāi)發(fā)和部署模式識(shí)別算法提供服務(wù)。
NuPIC:這是一個(gè)用 Python/C++ 編寫(xiě)的開(kāi)源項(xiàng)目,它實(shí)現(xiàn)了 Numenta 皮質(zhì)學(xué)習(xí)算法(Cortical Learning Algorithm),由 NuPIC 社區(qū)進(jìn)行維護(hù)。該 API 允許開(kāi)發(fā)人員使用原始算法,將多個(gè)區(qū)域(包括層次結(jié)構(gòu))串聯(lián)起來(lái),還支持使用其它平臺(tái)的功能。
PredicSis:從大數(shù)據(jù)中洞見(jiàn)趨勢(shì),通過(guò)預(yù)測(cè)分析來(lái)提高營(yíng)銷(xiāo)業(yè)績(jī)。
PredictionIO:這是在 Apache Spark 許可證下發(fā)布的基于 Apache Spark、HBase 和 Spray 的開(kāi)源機(jī)器學(xué)習(xí)服務(wù)。示例 API 方法包括創(chuàng)建管理用戶(hù)和用戶(hù)記錄、項(xiàng)目和內(nèi)容檢索以及基于用戶(hù)的推薦創(chuàng)建和管理。
RxNLP - Cluster Sentences and Short Texts:提供文本挖掘和自然語(yǔ)言處理服務(wù)。包含句子聚類(lèi) API(Cluster Sentences API),可以將句子(比如從多篇新聞中獲取的句子)或簡(jiǎn)短文本(例如來(lái)自 Twitter 或者 Facebook 的貼子)劃分成多個(gè)邏輯組(Logical groups)。
Recombee:通過(guò) RESTful API 提供數(shù)據(jù)挖掘、語(yǔ)言查詢(xún)和機(jī)器學(xué)習(xí)算法服務(wù)。