當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 最近,一篇名為《Using Deep Learning and Google Street View to EsTImate the Demographic Makeup of the US》的

最近,一篇名為《Using Deep Learning and Google Street View to EsTImate the Demographic Makeup of the US》的論文發(fā)布到了arxiv.org上,作為這篇論文的聯(lián)合作者之一,李飛飛在她的推特上向公眾推薦了這篇論文。這篇論文主要論述了如何將谷歌街景車搜集來的機動車輛數(shù)據(jù),結(jié)合機器學(xué)習(xí)算法,從而估算出本地區(qū)人口的特征和組成,甚至這一地區(qū)居民的政治傾向。

下面是這篇論文的一些節(jié)選內(nèi)容。

幾千年來,統(tǒng)治者和政策制定者進行全國人口調(diào)查,用來搜集人口數(shù)據(jù)。在美國,最細(xì)致的人口調(diào)查工作就是“美國社區(qū)調(diào)差”(ACS),由美國普查局執(zhí)行,每年花費10億美元和6500人以上的人力。這是一個勞動密集型數(shù)據(jù)搜集過程。

最近幾年,計算方法崛起成為解決社會科學(xué)領(lǐng)域問題的有效方法。比如用Twitter上的數(shù)據(jù)預(yù)測失業(yè)率、使用書里的大量文本分析文化等等。這些例子表明,計算方法可以促進社會經(jīng)濟領(lǐng)域的研究發(fā)展,最終可以詳細(xì)、實時地分析人口趨勢,并且成本很便宜。

我們的研究表明,結(jié)合公共數(shù)據(jù)和機器學(xué)習(xí)方法,可以得到社會經(jīng)濟數(shù)據(jù)和美國人的政治傾向。我們的流程里,針對幾個城市耗費少量人力來搜集數(shù)據(jù),然后用來預(yù)測全美的狀況。

具體而言,我們分析了由谷歌街景汽車在200個城市里搜集來的5000萬張圖片。我們的數(shù)據(jù)主要是關(guān)于機動車輛,因為90%的美國家庭都擁有至少一輛汽車,而且人們對汽車的選擇受到多種人口因素的影響,包括家庭需求、個人偏好和資金等。

基于深度學(xué)習(xí)的CNN計算機視覺框架,不僅能夠在復(fù)雜的街景下識別出汽車,還能鑒定出一系列汽車特征,包括材料、型號和年份。對于一個未經(jīng)訓(xùn)練的人來說,汽車之間的不同是難以發(fā)覺的。比如,同一型號的汽車,不同年份的在尾燈有微小變化(比如2007產(chǎn)的Honda Accord和2008年產(chǎn)Honda Accord)。然而,我們的系統(tǒng)就能夠?qū)⑵嚪殖?657類,每張圖片的分析時間只需0.2秒。該系統(tǒng)可以在2周時間里對5000萬張圖片分類,而一個專業(yè)的人類分類員,假設(shè)他每張需要10秒時間,將會花費15年的時間完成這個任務(wù)。

利用谷歌街景汽車搜集來5000萬張圖片,我們使用圖像識別算法(Deformable Part Model)來學(xué)習(xí)自動搜集汽車圖片。搜集每一輛汽車圖片后,我們部署CNN模型,用來進行物體分類,來判定每一輛車的材料、型號、車型和年份。然后,我們根據(jù)城鎮(zhèn)名字分類數(shù)據(jù)庫,劃分到兩個數(shù)據(jù)庫里。第一個是“訓(xùn)練庫”,包含了所有名字以A、B、 C開頭的地區(qū),這個數(shù)據(jù)庫包括了35個城市,訓(xùn)練產(chǎn)生模型;第二個是“測試庫”,包括所有名字以D、Z為開頭的地區(qū),這個數(shù)據(jù)庫用來提升模型。

我們總共搜集了2200萬輛(占全美汽車總數(shù)8%)汽車的數(shù)據(jù),用來準(zhǔn)確估算這個地區(qū)的收入、種族、教育和投票程式(voTIng pattern)。結(jié)果顯示出的關(guān)系出人意料的簡單和有力。比如,如果在一個城市里15分鐘的車程中,遇到的轎車數(shù)量高于卡車數(shù)量,那么這個城市傾向于在下屆大選中投票給民主黨(88%幾率);反之則傾向于投票給共和黨(82%)。我們的結(jié)果表明,自動系統(tǒng)監(jiān)測使用良好的空間分辨率,能夠接近實時地監(jiān)測人口趨勢,可以有效地輔助勞動密集型的調(diào)查方法。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉