原始資料、免費在線學習哪裡找?這些網站要用好

數據分析那些事
15 min readOct 15, 2021

--

資料集下載

100 多本免费机器学习书籍下载:https://www.theinsaneapp.com/2020/12/download-free-machine-learning-books.html

自動駕駛領域資料集

KITTI資料集https://www.graviti.cn/open-datasets/
CityScapes資料集https://gas.graviti.cn/dataset/graviti-open-dataset/CityScapes
BDD100K資料集https://gas.graviti.cn/dataset/data-decorators/BDD100K
nuScenes資料集https://gas.graviti.cn/dataset/motional/nuScenes

目標檢測資料集

COCO資料集https://gas.graviti.cn/dataset/shannont/COCO
Pascal VOC2012https://gas.graviti.cn/dataset/data-decorators/VOC2012Detection
PASCAL VOC資料集https://gas.graviti.cn/dataset/shannont/OpenImages_v6

人臉識別類資料集

YouTube Face DB資料集https://gas.graviti.cn/dataset/shannont/YouTubeFacesDB
CelebA資料集https://gas.graviti.cn/dataset/shannont/CelebA
IMDB-WIKI資料集https://gas.graviti.cn/dataset/hello-dataset/IMDbWiki
LFW資料集https://gas.graviti.cn/dataset/graviti-open-dataset/LFW

人體姿態估計類資料集

LSP資料集https://gas.graviti.cn/dataset/data-decorators/LeedsSportsPose
FLIC資料集https://gas.graviti.cn/dataset/data-decorators/FLIC
MPII Human Pose資料集https://gas.graviti.cn/dataset/shannont/MPIIHumanPose

文字檢測類資料集

MNIST資料集https://gas.graviti.cn/dataset/data-decorators/MNIST
SVHN資料集https://gas.graviti.cn/dataset/data-decorators/SVHN
CCPD資料集https://gas.graviti.cn/dataset/data-decorators/CCPD

NLP資料集

common voice資料集【ASR】:https://gas.graviti.cn/dataset/hello-dataset/CommonVoiceCN
LibriSpeechASR 資料集【ASR】:https://gas.graviti.cn/dataset/hello-dataset/LibriSpeechASR
20NewsGroups 資料集【文字分類】:https://gas.graviti.cn/dataset/data-decorators/Newsgroups20
Mandarin Chinese Scripted Speech Corpus 資料集【ASR】:https://gas.graviti.cn/dataset/magichub/MAGICDATAMandarinChineseReadSpeechCorpus_1

醫學類資料集

COVID-CT資料集https://gas.graviti.cn/dataset/data-decorators/COVID_CT
開源資料平臺 Graviti,點擊https://gas.graviti.cn/open-datasets

報告下載

app指數報告https://www.appannie.com/cn/insights/
手遊行業報告https://newzoo.com/category/press-releases/
Global智慧機報告http://www.canalys.com/
Global廣告行業報告http://adfonic.com/
Global遊戲行業報告http://www.gamesindustry.biz/
Global移動行業報告http://www.ericsson.com/
comscore的網際網路行業報告http://www.comscore.com/
摩根投行報告https://www.jpmorgan.com/pages/jpmorgan

社會型別

資料中心https://stats.oecd.org OECD
香港政府資料中心https://data.gov.hk/sc/
聯合國http://data.un.org/
美國政府公開資料https://www.data.gov/
印度政府公開資料https://data.gov.in/

經濟型別

Bloomberghttps://www.bloomberg.com
世界銀行http://data.worldbank.org.cn/
交易所http://www.nasdaq.com/zh
美聯儲資料庫https://www.federalreserve.gov/data.htm
美國上市公司資:料https://www.sec.gov/

網路型別

SimilarWebhttps://www.similarweb.com/ (質量不錯但要收費)
NET MARKETSHARE 市場份額資料

傳媒型別

BOM 票房研究https://www.boxofficemojo.com/alltime/
Movie Review Datahttp://www.cs.cornell.edu/People/pabo/movie-review-data/

大型資料集

AmazonWebService-datasetshttps://aws.amazon.com/cn/datasets/
Google datasetshttps://cloud.google.com/bigquery/public-data/
Youtube-labeled-Video-Dataset https://research.google.com/youtube8m/

建模和機器學習資料集

Kagglehttps://www.kaggle.com/datasets
Analytics-Vidhyahttps://datahack.analyticsvidhya.com/contest/all/
Quandlhttps://www.quandl.com/

國外學術資料庫

資料匯:國內的宏觀資料,國外的也有一部分,可以匯出來,免費好用。
http://www.shujuhui.com/database/
資料圈:免費共享平臺,行業研究報告,統計年鑑等
http://www.shujuquan.com.cn/
FREDhttp://research.stlouisfed.org/fred2/
OECD圖書館http://www.oecd-ilibrary.org/economics
臺灣學術資料庫:部分文章提供免費全文下載
http://fedetd.mis.nsysu.edu.tw/
臺灣大學電子書http://ebooks.lib.ntu.edu.tw/Home/ListBooks

國外資料

蒐集美國相關資料http://www.access.gpo.gov/eop/
Survey of Current Businesshttp://www.bea.doc.gov/
OECD的網址http://www.oecd.org/
IMFhttps://www.imf.org/
Heston-Summers資料庫http://pwt.econ.upenn.edu/
Madison資料庫https://www.hbs.edu/faculty/units/bgie/Pages/default.aspx
密西西比大學BillGoffe維護的一個網站http://rfe.wustl.edu

資訊類

中國票房http://www.cbooo.cn/
中國網際網路絡資訊中心http://www.cnnic.net.cn/
艾瑞網http://www.iresearch.com.cn/report/viewlist.aspx
易觀智庫http://www.analysys.cn/
遊戲產業網http://www.cgigc.com.cn/list/79644663134.html
百度指數http://index.baidu.com/
大數據導航http://hao.199it.com/
CSM(電視收視率)http://www.csm.com.cn/
微排片http://www.weipaipian.com

在線網站

ggplot2(绘图网站):http://ggplot2.org/

JavaScript 庫(绘图网站):https://d3js.org/

TensorFlowhttps://www.tensorflow.org/

搬書匠banshujiang.cn/

萬千合集站(高質量論文下載):hejizhan.com/bbs/

Oeasy(綜合影片教程網站):http://oeasy.org/

數字帝國(數學工具導航網站):https://zh.numberempire.com/

環球鋼琴網(高質量鋼琴學習網站):https://www.hqgq.com/

聲同小語種(多國語言學習論壇網站):http://www.somdom.com/

Onlinedoctranslator(免費線上文件翻譯):https://www.onlinedoctranslator.com/zh-CN/

Carbon(提升程式碼效率):https://carbon.now.sh/

ImageCyborg(一鍵下載當頁圖片工具):https://imagecyborg.com/

Imagetovideo(線上圖片轉影片編輯工具):https://imagetovideo.com/

Screenzy(線上一鍵圖片美化工具):https://screenzy.io/

PastetoGrid(線上照片拼圖工具):http://pastetogrid.com/

StockSnap(免費圖片素材高畫質資源庫):https://stocksnap.io/

線上pshttps://ps.gaoding.com/#/

PPT 超級市場(免费PPT模板下载https://pptsupermarket.com/

amcharts(地圖下載器https://www.amcharts.com/svg-maps/?map=worldRussiaSplitWithAntarctica

Echarts(視覺化圖表庫):https://www.makeapie.com/explore.html#sort=star~timeframe=all~author=all

vectary(線上實現 3D 建模設計神器):https://www.vectary.com/

FREE3D(15000+三維模型):https://free3d.com/

Blaze(實時檔案傳輸):https://blaze.vercel.app/

射手影音(一鍵播放各大影片網站和直播網站的影片)https://www.splayer.org/

SwitchHosts(一個Hosts 切換工具https://github.com/oldj/SwitchHosts

Foobar2000(一款老牌的音樂播放器http://www.foobar2000.com.cn/

資訊類

新浪科技http://tech.sina.com.cn/
騰訊科技http://tech.qq.com/
艾瑞網http://www.iresearch.cn/
藝恩網http://www.entgroup.cn/
虎嗅網http://wwww.huxiu.com/
36krhttp://36kr.com/
鈦媒體http://www.tmtpost.com/
遊戲大觀http://www.gamelook.com.cn/
億歐網http://www.iyiou.com/
媒介36http://www.chinamedia360.com/main

搜尋引擎推薦

  • http://scholar.google.com/
    Google學術搜尋濾掉了普通搜尋結果中大量的垃圾資訊,排列出文章的不同版本以及被其它文章的引用次數。略顯不足的是,它搜尋出來的結果沒有按照權威度(譬如影響因子、引用 次數)依次排列,在中國搜尋出來的,前幾頁可能大部分為中文的一些期刊的文章。
  • http://www.scirus.com
    Scirus 是目前網際網路上最全面、綜合性最強的科技文獻搜尋引擎之一,由Elsevier科學出版社開發,用於搜尋期刊和專利,效果很不錯!
    Scirus覆蓋的學科範圍包括:農業與生物學,天文學,生物科學,化學與化工,電腦科學,地球與行星科學,經濟、金融與管理科學,工程、能源與技術,環境科學,語言學,法學,生命科學,材料科學,數學,醫學,神經系統科學,藥理學,物理學,心理學,社會與行為科學,社會學等。
  • http://www.base-search.net/
    BASE是德國比勒費爾德(Bielefeld)大學圖書館開發的一個多學科的學術搜尋引擎,提供對全球異構學術資源的整合檢索服務。它整合了德國比勒費爾德大學圖書館的圖書館目錄和大約160個開放資源(超過200 萬個文件)的資料。
  • http://www.vascoda.de/
    Vascoda是一個交叉學科入口網站的原型,它注重特定主題的聚合,集成了圖書館的收藏、文獻資料庫和附加的學術內容。
  • http://www.goole.com/
    與google比較了一下發現,能搜尋到一些google搜尋不到的好東東 。它介面簡潔,功能強大,速度快,YAHOO、網易都採用了它的搜尋技術。各位可以一試。
  • http://www.a9.com
    Google在同一水平的搜尋引擎。是Amazon.com推出的,Webresult部分是基於Google的,所以保證和Google在同一水平,另外增加了Amazon的在書本內搜尋的功能和個性化功能:主要是可以記錄你的搜尋歷史。
  • http://www.findarticles.com/
  • 一個檢索免費paper的好工具。進入網頁以後,可以看到他有三個功能,driectory web article,其中article對我們很有幫助,你可以嘗試輸入你要找的文章,會有很多發現的!
  • http://www.emolecules.com
    在此搜尋引擎裡可以搜尋到超過千萬種化學品資訊或相應的供應商,與Chemblink有點相似,但提供的化學品理化資訊沒有Chemblink詳細,與其不同的是該搜尋引擎可提供化學品結構式搜尋(主頁上有線上繪製化學結構式的搜尋框)。
  • http://www.ojose.com/
    OJOSE (Online JournalSearch Engine,線上期刊搜尋引擎)是一個強大的免費科學搜尋引擎,通過OJOSE,你能查詢、下載或購買到近60個數據庫的資源。但是感覺操作比較複雜。
  • http://citeseer.ist.psu.edu/
    一個關於計算機和資訊科學的搜尋引擎。
  • http://hpsearch.uni-trier.de/
    專家個人主頁搜尋引擎。

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~

文章推選

10 部頂級數學紀錄片

Excel資料分析基礎知識

推薦10個鮮為人知的免費學習網站

--

--

數據分析那些事

這是一個專注於數據分析職場的內容部落格,聚焦一批數據分析愛好者,在這裡,我會分享數據分析相關知識點推送、(工具/書籍)等推薦、職場心得、熱點資訊剖析以及資源大盤點,希望同樣熱愛數據的我們一同進步! 臉書會有更多互動喔:https://www.facebook.com/shujvfenxi/