正在閱讀:科普一分鐘 | 人工智能當中究竟什麼是最重要的科普一分鐘 | 人工智能當中究竟什麼是最重要的

2018-11-17 00:15 出處:PConline原創 作者:Wesley 責任編輯:zhangxiaomeng

  【PConline 技術】毋庸置疑,目前我們正身處在人工智能的時代當中,在我看來,對於人工智能來說其背後最重要的無疑就是數據所產生的價值,對於人工智能當中的數據來說一直有一個被稱之為“數據集”的概念,它是根據數據的性質、類型和領域等對數據進行劃分的一種規則,我們日常所感受到的“智能化”的改變很多也是來自於數據集當中的技術體現。

1

  對於人工智能的背後數據來說可以說是至關重要的一個環節,如果少了這些數據,可以說機器學習和深度學習模型幾乎什麼都幹不了了,透過創建數據集能夠讓人工智能模型在進行平時訓練的過程當中變得更加容易。

  讓人興奮的是,在海量的實驗數據集當中有很多非常有價值的數據集組成了後來人工智能的“學術基準線”,從而被很多的研究人員開始引用,尤其是在很多算法的比對方面,像MNIST、CIFAR 10以及Imagenet等應用都是遵循了這一基準線。

1

  那麼對於人工智能領域當中,究竟有哪些時延數據集是非常有用的呢?接下來我們就一起來看看。

  MNIST

  這是一個針對小型灰度手寫數字的數據集,其開發時間再20世紀90年代,最初其主要用於測試當時最為複雜的一些模型,如今MNIST數據集可以幫助更多的視覺深度學習去進行教學應用,很多版本的數據集已經捨棄了原始的特殊二進制的格式,轉而採用標準的PNG格式,這樣做的好處就是可以方便在現在很多大型代碼庫當中用戶可以進行正常的工作流操作。

  值得一提的是,如果用戶只是單純想使用與原始同樣的單輸入通道的話,只需要在通道軸當中選取單個應用就可以了。

  CIFAR10

  CIFAR10數據集擁有十多個類別,其中多達60000張32*32像素的彩色圖像,這當中包含了50000張訓練圖像和10000張測試圖像,堶悼郁”C種圖像的數量超過6000張之所,它們被廣泛應用於測試新算法的性能。

  CIFAR10版本的數據集捨棄了原有的特殊二進制格式,也是採用了標準的PNG格式,從而方便了目前大多數代碼庫中作為正常的工作流進行使用。

  CIFAR100

  和前文所提到的CIFAR10類似,CIFAR100只是擁有了超過100種類別,其中每一個類別當中包含了600張圖像,在這600張圖像當中不僅包含了500張訓練圖像,還包含了100張測試圖像。

1

  透過對100個類別進行20多個細節類別的劃分,使得其中每一個數據集當中的每一張圖像都自帶一個精細化的標簽和一個粗略的標簽,而這些表現則分別隸屬於所屬的超類當中。

  Caltech 101

  這個數據集當中包含了101種物品的圖像,其中平均每個類別擁有超過800張圖像,其中很大一部分類別的圖像數量固為50張左右。每張圖像的大小約為300*200像素。本數據集也可以用於目標偵測定位。

  Oxford-IIIT Pet

  Oxford-IIIT Pet數據集當中包括了37種寵物類別的圖像數據集,其中每個類別大概擁有超過200張圖像,這些圖像在動物的比例、姿勢和光照等諸多方面均有著豐富的變化,這個數據集也可以用於目標偵測的定位應用。

  自然語言的處理

  IMDb Large Movie Review Dataset

  用於情感二元分類的數據集,其中包含25000條用於訓練的電影評論和25000條用於測試的電影評論,這些電影評論的特點是兩極分化特別明顯。另外數據集堣]包含未標記的數據可供使用。

  人工智能與數字化之間的聯系

  在很多行業當中,人工智能領域會遵循數字化的發展規律和浪潮,也就是說把本是模擬的東西或者是抽象的東西全部用數字化的形式錶現出來,許多行業的數字化革命首先創造出了數字數據。

  這樣一來就可以發現一些數據科學,用戶可以從當中穫得更多的見解,人工智能的背後只有在真正穫取了數字數據之後,人工智能才可以非常高效地利用這些數據創造出更大的價值來。

1

  在我看來,真正的人工智能組織在數據採集方面是非常複雜的,並且具有的戰略性要求也非常之高。例如,你在一個區域發佈了一個產品,如果你可以擁有足夠的數據來推出足夠好的產品,那麼你可以納入正反饋循環,讓用戶幫助你產生更多的數據。更多的數據會使產品更好,然後你就會有更多的用戶。而且這個積極的反饋循環可以讓你不斷地積累數據,所以也許在幾年後你就可以擁有一個相當可靠的生意。

1

  這就好像當今很多大型網路搜索引擎那樣具有令人難以置信的寶貴數據資產和數據價值一樣,在海量用戶透過搜索引擎進行很多特定事物和網頁進行搜索的過程當中,該數據資產對於構建一個好的網路搜索引擎就是非常有價值的。

  AI做支撐,究竟是什麼體驗

  對於人工智能來說,目前有很多企業和公司透過運用人工智能技術和應用來推動公司進行轉型,甚至去引發一些新型公司的興起,對於當今很多互聯網公司來說其根本其實並不是在運營一個網站,而是管理者是否能夠設計出一個公司,從而能夠充分利用互聯網去提供很多新功能,這點對於人工智能時代來說或許是最大的改變。

1

  近些年伴隨著人工智能技術的興起和應用,已經有很多公司正在不斷研究如何構建一家公司去使用人工智能的諸多功能,就像建立一個網站不會讓你成為一個互聯網公司一樣,在機器學習問題上做一點東西也不會讓你成為一個AI公司。

  編輯的話

  對於人工智能應用來說,從技術的創新到應用的落地,是推動整個產業和社會走向智能化的重要推動力,本期我們透過對實驗數據集在整個人工智能應用和企業應用進行分析讓我們感受到了人工智能時代的到來對於改善未來工作與生活方式起到了至關重要的推動作用,同時面對激烈的市場競爭的挑戰,人工智能技術的應用也將會幫助更多的企業用戶獵取更大的市場空間和機遇。[返回頻道首頁]

 
來不及淘寶了 教你3分鐘做出高顏值紅包封 醫院內網染病毒履殺不止 真相竟然是這樣的 出門找個車位真是難 未來用AI即時預判空車位? IPv6終於迎來發展元年 卻擋了SDN的前路? 3D列印的磁性網格機器人長這樣?可抓取小物體

為您推薦

加載更多
加載更多
加載更多
加載更多
加載更多
加載更多
加載更多
加載更多
加載更多
最新資訊離線隨時看 聊天吐槽贏獎品