白白色小明看看首頁螞蟻邦2015年三月匯實錄:讓你的數據會講故事
我們通過什么方式呢?我們通過的方式就是,我們引入了大量的互動的特性。首先第一個特性,拖拽重計算,這個圖描述的是瀏覽器的占比,大家可以看到傳統的餅狀圖我們可能看到的就是一些數據怎么分布,比如這個圖我們想知道它的占比是多少,我可能打開一個計算器再加一下。在ECharts我們可以很簡單的拖拽一下,這兩個就合并在一塊了,這是拖拽重計算。
其實剛才我們介紹了有很多圖表,其實真正使用的時候可以根據你實際的需求,我們可以把這樣的一些圖表,按照你這種需求去做這種混搭。
給大家介紹幾個工具,跟數據可視化有關的工具。這里頭首先要說就是ECharts,這常好用的可視化工具,非常方便,我們是它最早的用戶之一,因為它剛剛做我們就拿來做數據新聞了,我們一直都有合作和溝通,非常好做的工具。還有一個基礎的工具是什么,我想大家都認得出來,Excel,常非常好用的工具,我們絕大部分用Excel的人用不到1/3,因為功能太強大了,不管你做什么Excel都必須精通,它可以幫助你做數據的篩選、分析等等。還有Tableau,是美國的可視化工具,它的功能比ECharts要強,但是更笨重一些,因為里頭還有對數據庫的接口,還有一些數據分析的功能,不僅僅是畫圖。ECharts是在畫圖上非常強的工具,Tableau例如說你把一些數據直接往里一填,就可以做成非常豐富的圖表了。所以這三個是值得我們了解的工具。
我們還是回到剛剛的圖,這個圖大家看特別的復雜,眼花繚亂的,我們提供的一種東西就是圖例開關,很簡單,左邊有這樣的圖例,你點掉哪個就消失,再點就打開。
喬宇:感謝祖明,我就不拿給我準備好的串詞了,因為我剛才在準備PPT里面看到一頁,應該算是ECharts的客戶名單、合作伙伴名單,正好有新浪新聞LOGO出現,因為下一環就是新浪新聞的同事還有小朋友一起來出現,為什么叫小朋友?確實年輕,我在新浪是一個老人了,我在新浪有差不多10年了,非常有幸我了新浪新聞在追求快速、追求準確、追求客觀上的能力,這些年新浪新聞實際上也在數據新聞做了很多探索,現在有請我的同事新浪新聞主編盧旭寧同學上臺來給大家分享一些。
盧旭寧 新浪新聞主編
第三個,叫可視化分析。什么算可視化分析呢?還是大家很熟的,K線圖,把每天的股票交易數據變成一根曲線,體現它的最高價、最低價、成交量等等,這是一個K線圖,一個有經驗的股民一看就能猜出來明天會漲還是會跌,這就是可視化分析。所以數據可視化這種東西聽起來好像沒有什么聽過,實際上我們每天都接觸無處不在。如果我們把可視化和新聞結合在一起就成了數據新聞。數據新聞我們又有兩種表現形式,一種是信息圖,信息圖其實這個我們看了很多了,我們經常在網上看到說一張圖告訴你什么什么,這種東西最典型的信息圖了,信息圖至少有100多年的歷史,包括以前的報刊上大量有信息圖,包括我們小時候上學,這個教科書里頭也有大量的信息圖。另外一塊是我今天重點要講的,就是這個互動圖表,互動圖表是用代碼在網頁上呈現數據新聞或者各種數據可視化的內容,這個我們成為互動圖表。
右邊的是漏斗圖,傳統的漏斗圖是外面的這一層,加上比較淺的顏色,傳統的漏斗圖有一個問題就是說,可以很形象的表現從上游到下游數據的關系,但是沒有辦法很準確地表達出是真實的一個數據是怎么樣變化的,所以我們這里面做了一個創新就是,我們用了兩層的,最外層我們還是用形象的方式,但是里層我們通過這種實際數據是多少我們就做出多少這么一個方式,來真實的表達數據。
這個混搭非常有意思,這不是我們自己做的,是我們的一個用戶做的,他做完這個圖以后我們覺得很有意思,我們從來沒想到我們這種餅圖可以這么用,我們也給它起了一個名字蟲洞,就是一個很科幻的東西。
我們做這個項目一共就做了半天的時間,一共就那么兩三個人分享出去,也沒怎么做推廣,第一天有3千的訪問量,第二天有5千的訪問量,第三天突然就變成了30萬的訪問量,第四天就變成50萬的訪問量,就爆炸了,這一個星期下來總的訪問量是150萬,所以我就覺得這個非常有意思。這個是我們6月份做的,后來也有更多的人就發現了這個規律,所以后來各種朋友圈游戲你就發現很多了,像神經貓,就各種刷屏。也有人就嘗試說,用游戲的方式去推一些東西。
大家看到了,按照2014年的預算,中央92個部門它的整個三公消費的金額是多少呢?大概61個億,這個數字非常非常準確,因為所有的數字我們都是從網站上抄下來的,并且所有數據的精度是跟一模一樣的,這個是數據庫。我想關心哪塊呢?我把鼠標挪上去都可以看得出來,哪個部門花了多少錢,可以每一年的去看,他是屬于哪一類的,底下我們分了好多類的部門,都有很大的分類。一直以來,國家稅務總局都常大的部門,因為他是負責掙錢的部門。
現在是我們做的用可視化交互工具,就是剛才祖明老師講的ECharts這個工具做的交互化數據,比如說還是反腐的問題,這些官員他們落馬究竟是在哪兒,他們當時落馬的時候職位是什么東西,比如他們分布在、政協,他們在哪個省是最多的、哪個省是最少的,這都是可讀性比較強又有意思的東西。
劉葉 新華網數據新聞部首席前端工程師
另外一個是中國新陣容,是2013年的時候推的東西,2013年正好面臨我們換屆。大家知道國家官員常多的,中央官員更是很多,有很多部委大家可能都數不過來,但是如何能讓網友輕輕松松的了解這個情況,從習總、李總開始,一直到最底層的比如說副部長之類的官員,把他呈現出來,我們采用了這種交互可視化的模式,呈現的效果還是很好的。其實中國我們在國內做這種時政報道,可能很多傳統的同事也知道,你做了一個很好的報道,緊接著就是急電下來了把你搞掉或者刪掉或者IP屏掉。但是我們做的是另外一個情況,我們做的這個東西,監管部門是很高興的,覺得這是我們做時政新聞應該有的方式,這也是挺奇妙的東西。
除了這個以外,他還促進了我們的新聞工作流程的變化,我們后來改了一個規矩,就是說你做重大報道的時候,這個報道組里頭必須有程序員參加,程序員在里頭起兩個作用,第一個,他會跟你一起去制作數據新聞,第二個,特可以給你提供一些技術上的指導,能幫助你提升效率,這些都是我們做這個報道所獲得的收獲,這是大概一年半以前的事,之后我們不斷的在這里頭獲得各種好處。
另外我們也提到了,剛剛展示過了力導向圖復雜關系的呈現。這個力導向圖我們和百度的另外一個互聯網數據庫做了合作,做了百度人物的知識圖譜這么一個產品,比如大家在百度搜《小時代》,搜比較火的明星郭敬明之類的,會出現這樣一個關系圖,里面就是把比如《小時代》里所有的演員之間的關系呈現出來。
喬宇:各位新朋友、老朋友,今天有很多熟悉的面孔在這里,歡迎來到螞蟻邦三月匯的傳媒沙龍,我是喬宇。老朋友我就不多介紹了,新朋友我說一下,我現在是新浪市場與戰略合作部的總監,很多朋友在私下里戲稱我為喬幫主我不知道為什么,有可能跟大俠有關系?我身為一幫之主深感壓力,我覺得應該做點事以感謝大家的支持。
舉個例子,比如我現在點周濱這個,周濱是他的小兒子,周涵是他的大兒子,黃婉是周濱的妻子。這邊4個有紫色線連過去代表什么呢?這4個人都是代表他出面搗騰生意的人,我們稱為白手套。周濱名下其實他直接能看出關系的只有兩個,一個叫興鼎電力,一個是中旭陽光能源,中旭陽光光能下面有兩個,一個是子公司,還有一個是中國石油加油站的項目,這是的線,說明這個項目不是他的,他從這里頭掙錢。這個項目是誰的呢?我們點一下這邊看一下,我們可以看一下,這個項目是中石油的,中石油當時蔣潔敏是董事長,他從這個項目里面掙錢。這家公司的股東還包括黃渝生、還有周敏利。
下一個就是我們的PC端交互可視化。這個PC端交互可視化我們也是從2013年初的時候開始做,我覺得大型報道也是一個不可或缺的重要報道手段,比如我們普通頁面就通過手寫JS和頁面填充完成的交互可視化產品,可視化交互就是用剛才祖明講的ECharts來做。
這個是當天晚上我們的記者潛入到現場拍下來的照片,可以看到包括說半圓形的樓是哪個呢?就是這個樓,都可以對照著看。
所以這樣的話,我就把整個大面給它體現出來了。但是還會有人說,但是你這樣不行,這樣眼睛很花,根本看不清楚,我該怎么辦呢?我們這里頭就要涉及到互動了。涉及到互動的操作,你看第一個,我把鼠標放在任何一個人的名字,你們看右上角,就會出現他的照片、名字,還有他的文字報道等等,會出現在右上角。第二個,我關心誰,我就點一下他的名字,那么我就只把跟他有關的事情突出出來,而其他的東西我可以暫時就忽略掉。
(播放短片)
這個項目是去年我們做的一個比較成功的項目,最后這個項目也拿了不少,我們拿到美國去參,SND,攝影師協會我們在那兒拿到了優秀,在騰訊那邊拿了一個年度數據新聞,在網易那邊拿了一個年度多報道,其他的一些項其實現在還沒公布。這個是我們去年做的一個比較滿意的作品,是關于的這個。
喬宇:剛剛在黃總的可視化實驗室里頭轉了一圈,我也深受震撼,在朋友圈里分享了兩組圖,分享完了我看點贊和評論的,每一組圖大概有30多個,一瞬間就出來了,所以大家對這塊東西還是蠻感興趣的。
這是林峰同學在我們ECharts女生過生日的時候,拿圖說做了一個比較程序員范兒的賀卡,說你越來越有錢、越來越漂亮。
第二個,內容挖掘的問題,如何挖掘、從哪里挖掘,我覺得我們現在的那個挖掘的視野可能還不夠寬,還比較窄。舉個例子來講,像這兩天那個飛機失逝,紐約時報他們做的新聞,按他去展示這個的時候,他就直接找了他們的地形圖,再加上那個飛行軌跡,給組了一個可視化新聞出來。我覺得像紐約時報這種做法,說實話它數量跟產量、跟質量都是有的,都確實比較高,確實是我們學習的對象。舉個例子來講,這個做法我沒有想到,或者我有想到來不及做。
這個互動圖表其實還有一個展示的途徑,一個在電腦上展示,一個手機上展示,我先給大家演示說我們怎么在電腦上展示這個東西。
可視化還有很多其他的應用,例如說什么呢?給大家舉個例子,這個東西是去年12月31日晚上上海的外灘。我們都知道,那天晚上的上海外灘發生了一個,有很多人不幸遇難。這個圖展示的是什么?這個圖展示的是那天晚上這個地方的人口密度,這個稱為什么?這個稱為密度圖,前面這張是另外一個時間點的人口密度,我們看這個東西就可以很容易的理解說,都不用解釋,就能本能的感覺到黑的地方人不多,越亮的地方人越多,黃的、紅的表示人口密度更高,如果說里頭還有一塊紅的發黑的,那表示人口最密集的地方。這個地方是“陳毅廣場”,你看這個地方人口密度是不是最高?事故最后就發生在這個地方。這個數據從哪兒來的?這個數據是從運營商來的,我們每個人我們每天帶的手機,運營商知道你這部手機在任何一個,誤差不超過幾米。所以其實運營商有最詳細的數據,知道所有人分布在哪里。
接下來我會跟大家分享一些資源,大家可以看一下,其實做數據可視化也會有很多的案例了,我給大家看一下這些的案例,大家可以試一下,這個是我那天隨便在網上找的圖,大家可以試試,看看這種東西里頭什么地方做得好、什么地方做得不好,或者就找什么地方做得不好,這面沒有什么做得好的。
第一本《用幻燈片全世界》,有的人會講說,你明明講的是可視化,為什么扯到幻燈片上去了,PPT就是一個最常見的可視化作品。什么樣是爛的PPT,就是把Word文檔直接往上貼,好的PPT是給一個提綱幫助理解。
這邊我所講的數據,數據不僅僅是只有數字才是數據,地理信息、文字、音頻、視頻等等,這些都是數據。所以我們就把這些數據抽出來,抽出來以后我們做成了這么一個作品,它怎么看呢?第一部分是人,展示人跟人之間的關系,第二部分,第二排跟第三排是公司,展示公司之間的關系,第一跟第二排之間展示的是人跟公司之間的關系,我們用這樣的方式把這種東西楚。
所以我們現在比較注意的一點就是說,我們積極從外部去挖掘一些數據源,例如說分享了一個像NASA,有一個數據是全球的地面地貌圖,每16天更新一遍,放在服務器免費使用的,這個其實很多人不知道。這種如果我們要做新聞時候,知道這些數據都可以調出來用的,我覺得我們對這種東西還不夠熟,如果更熟的話,例如我們都沒有跑去國圖,你們已經跑到國圖了。例如像現在國外很多大學,像哈佛,很多學校他們圖書館大量的在線數據,我們也還沒有挖掘出來,所以可以用。
最后我們都編輯好以后我們可以把它做分享,你是要公開的,還是私密的,公開的話就可以是有很多方式,比如說第一個,我們是給你一個鏈接,你通過這個鏈接直接發給別人,別人就可以看到你做的這個可視化。然后你可以向,比如大家做某個網站,里希望把這個圖表嵌入到自己網站,可以通過這種代碼的形式嵌入進去,也可以根據我們的方式更新到微博、朋友圈或者什么地方。你也可以是這種私密的,我們像網盤一樣提供一個碼,別人有了這個碼之后才能看。
當然我為什么這邊一直強調說數據新聞呢?大家現在有些時候會把H5的東西跟數據新聞混在一起,說實話做H5,H5是HTML5的簡稱,不難,很簡單,現在會做的人少,大家覺得挺稀奇的,物以稀為貴,但是過幾年就沒有什么稀奇了,滿街都是了,這個時候就得比創意、比設計,跟網頁設計其實沒有什么區別。我們只要把住數據可視化這一塊,我知道怎么用最準確的形式去表現這個數據,怎么能幫助你迅速的理解數據,和你怎么幫助你把枯燥的數據傳遞出去,這是我們把握這件事情的核心,所以我們也是這么做的。
下一個項目,這個項目叫做“星空彩繪諾貝爾”,這個項目是我們把這100年來的諾貝爾獲者的數據變成一個彩色的圖形,一個很漂亮的圖案,讓大家看的比較舒服。我們怎么來設計這個東西呢?我們先看最外面這圈是年份,再往里頭,從東往西是這些獲的國家。國家的名稱旁邊有一道杠杠,這條杠杠就是國家獲人的總數。再往里頭這一圈,標的是人的分布,獲人的分布,年齡,每個年齡段從里到外是分了幾個年齡段,顏色代表他獲的種類,這有圖例,這個也代表獲種類。這個圓圈大小代表獲人數的多少,這是一個統計圖。然后他還可以自動播放,我們點一下自動播放,我們就可以看到他一年一年的往前走,展示每一年的獲者名單,我們可以看到很詳細的獲者名單,包括是男、是女,分布在什么國家,是什么項等等。其實我們可以看到就是說,在一戰以前基本上獲的人都集中在歐洲的,尤其是英、法、德這幾個國家,我們可以看的非常明白。
這是我們跟百度人氣合作的一個案例,大家可以訪問,亮的越多的地方使用的定位越多,我們看廣東、、上海這三個地方是使用人群最大的。
第二方面,我覺得數據新聞和數據可視化也是我們進行內容生產的一個方式。說實話,我們可能做的家都知道,對于門戶網站來講,國家的管制是比較嚴格的,就是說不能原創,但是如何在這方面尋找自己內容生產的渠道呢,數字化新聞就是一個可供選擇最好的渠道之一了。因為我們很多內容其實存在于數據當中的,剛才黃志敏老師也說了,很多數據是零散的,沒有經過整理的,如果我們把這些數據整理出來,用一個大家能接受的方式給它呈現出來,這就是一個非常好的內容,我下面會接著繼續講這個問題。
接下來我們要講數據新聞這一塊。數據新聞它有一個大概的基本概念我希望跟大家分享。第一個,可視化,可以分為三塊,第一塊,科學可視化;第二塊,信息可視化;第三塊,可視化分析。實際上這些東西我們都特別常見,雖然說這個名詞和陌生,但是我跟你們一講就知道了,什么是科學可視化像這個地圖就是科學可視化,到醫院拍CT也是科學可視化,他在地理領域、醫療領域應用是比較多的。什么是信息可視化呢?信息可視化背后這個地方有塊牌子,亮的牌子寫著安全出口,一看都知道了,這就叫信息可視化。廁所門口那塊牌子也叫信息可視化,包括太多了,數不完了,這都是信息可視化,所以這個信息可視化也常常見的東西。
國家反腐戰役,這是2014年推出的東西,當時反腐也形成一定的陣勢了,落馬的官員非常多。
這是地圖跟餅圖的混搭。
所以我們現在一個原則叫移動優先,就是說當項目我盡可能的話是電腦也做一個、手機上也做一個,但是如果我顧不過來的話怎么辦,我電腦寧可不做了,手機是一定要做的,這是我們所謂叫移動優先的原則。
這里頭唯一一個,后面有一個過人,應該沒有事情。現場工作人員里頭唯一一個幸存的可能是這個挖掘機里頭的駕駛員,因為后來據記者采訪他說,他就說,他當時的感覺,是感覺突然間轟的一聲,感覺自己像坐在井底一樣。為什么像坐在井底呢?覺得四周圍都是黑的,只也有一塊是光亮的,就是坐在井底的感覺,因為都是黑煙嘛,他突然間摔下來,覺得自己還沒有死,趕緊撒腿就跑,躲過一劫。但是聽說這個人后來也被關起來了,因為他們要事故責任,所以這個事情貌似到現在也沒有一個最后的處理結果。
這個項目,做數據新聞有一個特點,跟原來的新聞不一樣,它是的,每年都可以往里補數據,一年一年往里補就完了,三公消費也是類似的情況,隨時可以往里補,一直都有用。這個項目我們是參加了英國的叫做“信息之美——信息可視化設計大賽”,是入圍了,沒有拿到,但是我們入圍了,我們去參加這種國際比賽的目的是說,要去跟世界最強的團體去比賽、去競爭,然后來逼著我們去提升自己。
再給大家分享一下資源,這個是我建的一個群,是財新數據可視化分享的群,這個群里頭有300多人,基本上有幾種人。第一種,主要是業界跟數據新聞有關的,有很多的人。第二種,就是學校的老師,主要以教新聞、教可視化的老師為主。第三種,相關專業的學生。300多人,現在自己加不進去了,只能找里面的人加進去。這個群的特點,大家在里頭做一些案例的分享、資源的分享,還有一些業務的討論等等。
我們為什么要在數據新聞里引入度的概念,這樣我想先闡述一下我的觀點,首先說新聞本身它就是的,如果我們把它想象成一個多面體,它本身具有非常豐富的多面性,這個多面性的組合和關系就區別于新聞事件和另外一個事件的特點,同時受周圍的影響,同時這個新聞事件發生之后又會對周圍的產生反作用力,所以我們說新聞本身就是的。
我就想引入之前我看的一個非常好的叫“Embrace Complexity”這個文章提到的,我們不要回避復雜。
我想現場做個小調查,咱們現場多少人見過這個作品? 大概有一小半見過這個小作品,簡單說這個作品叫“的人與財”,主要在這個案子里里頭涉及到的很多的人和很多公司的這些關系。在這里頭我們可以看到就是說,我分為三部分,我為什么要做這個東西呢,因為當時是7月29日那天受賄調查,這是晚上6點的事情,半小時以后6點半的時候我們就發布了一個6萬字的調查報告,叫“的紅與黑”,半個小時以后訪問量漲了10倍,整個帶寬就全部擠滿了。那天晚上大概11點多的時候,我們發布了“的人與財”這樣的新聞,引起了非常大的關注。
大家都知道,包括剛才黃老師也提了百度祖明先生他們做的ECharts這個產品,我就不班門弄斧了,因為我看了一下,來之前我準備了一下搜了一下ECharts這個產品,雖然我是學理工科的,但是研究起來我覺得還是有點難度,我就不班門弄斧了,下面有請百度復合搜索部前端團隊經理祖明為我們帶來分享。
我今天的分享就這么多。謝謝大家!
基本上像我們這兩年做的比較多的是反腐題材,基本上是這么做的,可能一有一個公布出來,晚上6點紀委說抓誰了,基本上幾分鐘之內我們就會發一個快訊發到微博上,說誰誰被逮了,10分鐘之內我們會有一篇新聞出來,這篇新聞除了快訊里頭的簡單內容以外,我們會補上被抓的這個人的簡歷。我們會補上去,并且如果說我們對這個人被抓的原因有一些可能的推測的話,那么我們在這個新聞里面基本上會跟著一個大概1千字以內的網稿。可能再過幾個小時,在當天之內我們會有一篇詳細的發出來,來楚他的一些相關的事情和可能牽扯到這里頭的一些背景資料,可能會有幾千字的。之后如果說這個人還得再深挖的話,我們會有一個大幾千字、上萬件的調查,后續會發出來,那個時候有可能發在網站上,也有可能是發在上,或者說都發,我們基本上是這么一個流程。所以我們現在基本上就是,其實完全是一個新的做法,并且我們追求說,手機上比電腦上還要再快一些,這都是我們現在做的。當然之所以說我們能夠按照這樣的速度去做事情,也在于說我們平時的積累,平時像這些官員的數據庫、人物數據庫其實我們都是準備的很齊備的,所以很多這么去做。所以這是我們財新傳媒現在大概的一個情況。
關于這個,也是我們去年,應該是去年在誕辰110周年的時候做的一個東西。這個人是很特別的一個人,談中國的當代史,談80年代之后的歷史,一直到現在,已經是繞不過去的。在中國,談所謂的進一步深化,都繞不過這個人,但是怎么呈現這個人物背后的一些東西呢,談他的生平大家都知道,他是怎么怎么著,連篇累牘的在解讀這個東西,沒什么意思。他背后的生涯是怎么樣的,他的情況是怎么樣的,他背后有幾起幾浮的情況究竟用什么方式呈現出來,我們發現一個特別好的呈現形式就是說,他在上出現的次數。我們發現從1949年到2014年,他在上出現的次數是有規律可循的,而這些都折射出中國整個生態的變化,比如說我們在1966年到70年代的時候,我們會發現在上出現的次數會急劇減少,到最后干脆不提了。到1975年的時候這個人又出現,就是折射出當時的狀態。
今天的沙龍主題是“如何讓你的數據會講故事”,那些看似高冷的數據新聞到底怎么玩,再過一會兒幾位潛伏已久的業界大牛就會浮出水面,和親們分享解讀數據運營和思,看看如何讓數據自己會說話、自己講故事。
ECharts其實在百度里面基本上所有的產品線都覆蓋了,包括大家可能接觸的比較多的,像遷徙,像百度統計這樣的產品,其實ECharts我們覺得最成功的地方是在于說有很多的朋友在使用,比如說有很多很多的我們想象不到的,其實我們并沒有做用戶統計,都是突然間有一天我們看到有阿里或者騰訊郵件的詢問就過來,我們才知道這個公司在使用我們的產品。
給大家介紹三個網站。第一個是我們的網站,我們的所有作品,其實我們做的作品這兩年我們得做了一兩個作品,都放在“數字說”這個網站,大家可以上去看。另外一個網站,是我們實驗室的網站,實驗室的網站其實更多的是放這種資源,例如說我們對可視化項目是怎么設計的,設計思是什么,還有其他或者其他別的包括國外的一些成功案例,案例分享,還有一些工具,還有數據庫等等,我們都會放在,還有很多學習資源。第三個,“數據新聞網”,是幾個年輕人,他們都是又對新聞感興趣,又對設計或者說對代碼感興趣的人,有的在美國留學,有的在,有的在歐洲,他們一起做了這么一個公益性的網站,有非常多的跟數據新聞有關的資訊跟資料的分享,大家有興趣可以看。
ECharts除了剛才所談到的各種交互特性以外,其實ECharts還有和其他競品特別大的區別,就是我們大數據的能力。我們知道因為像瀏覽器的這種性能所限,像傳統的圖表,包括目前可視化領域最牛的,他們都是用這樣的方式去實現的,他們可能在使用數據的時候有能力,一般4萬個數據的時候就扛不住了,但是ECharts是用另外的數據,這是ECharts和其他競品相比脫穎而出的特性。
現在我們看一下現場照片,看事故現場照片其實這個事情不新奇,但關鍵在于說你用這種方式去看的時候,你對現場有一個很直觀的認識和了解,例如說我們看到這個樓被炸的破破爛爛底下都成這樣了,本來是什么樣子呢?就是這個樓,本來挺好的一個樓,現在被炸成這個樣子,所以這個我們就可以有非常非常直觀的感受。
如果說我們在做產品的過程中把更多的考慮進去的話,舉個例子像我們做搖車號那種,做的時候已經考慮進去如果它能的比較廣,我們就覺得比較劃算。其實我也看到你們有在做這方面的工作,我認為大家都下意識的會做這種事情。但是沒辦法吧,成本這件事情可能真的是沒有什么太好的事情,但是我現在用的方式就是說,我會控制總的成本。舉個例子來說,像我們實驗室大概10個人左右,但是專門做這個事情的,專門投在數據新聞里頭的,應該來講就是4個人,其他人還會兼顧干別的。所以基本上我的成本封頂算得出來的,就這么多,我只是從內部去挖掘它的產量,我覺得這是第一個。
我們可以看一下這張照片,這張照片是唯一一張不是我們拍的照片,是在事故發生前3個小時拍的一個照片,他們就在這里修補,拍照片的人拍完照片以后他們離開這個工地,其他的還繼續工作,后來照片里的人差不多全部都遇難了,所以這是他們最后一張照片。
想說數據可視化其實有三門基本功課,說白了很簡單,HTML5、CSS3、JS。
這個看看問題在哪兒?有人說百分比應該用餅狀圖。這個不一定,這種東西用柱形圖是可以的。有人說看著亂,這是一個總體感覺嘛,問題在哪兒。您說到顏色,為什么一個紅、一個黑呢?通常你區分兩個顏色就一定要說明說,紅的是一種含義,黑的是一種含義,但是你發現紅的和黑的就沒有任何含義,就為了所謂的好看把它隔開。還有數據相加不是百分之百,這個我還沒有加過,這就是大問題了。
給大家推薦幾本書,這幾本書不是說好書只有這幾本,而是這幾本書我都看過,并且我認為說它即使零基礎的人都可以看,非常有用。
剛才還說到的變遷,我們可以看到比如在70年代之前或者干脆80年代之前很少講到這個事,但是到80年代之后發現這個事突然熱起來了,說明我們國家的整個生態發生了很大的變化。
這個作品在兩天之內獲得了20萬的訪問量,大家也都知道,其實這是一個商業作品,你如果說作為廣告你要想獲得20萬的點擊的話,差不多按一個點擊10塊錢的話,你得花200萬,他做的投入顯然小的多得多,對阿里來講也常劃算的。所以后來我們還幫,除了一直幫阿里做,也幫別的客戶做了類似的項目。還有企業,因為他們想做年報,他們就找我們,因為他們覺得說我們做這塊是比較擅長的。
理論上來講,基本上這種東西很少不能做,但是更容易出現的情況是什么,開發成本太高,可能時間上來不及或者不劃算等等。這種情況底下怎么辦呢?這種情況底下咱們改設計唄,調的怎么樣更好做一些,就是一個互動的過程。等到這個方案確定了,反過來有可能就是說回去得去要求這個記者說你去補充更多的數據和資料,他有可能是得這么做,所以本身是一個互動的互推的過程。這三個合作以后,他最后出來一個數據可視化的一個作品,接下來給大家做一個具體案例的介紹。
在我們ECharts剛推出的時候很多人問我們,市面上已經有很多的圖表庫,包括全球最流行的,當然也有華人做的一些,為什么你們還做這個東西呢?我們做ECharts其實最大的動力是說,我們想做不一樣的東西,業界所有的圖表庫大家可以發現在Web看到的圖表,大家看到的圖表都是很單一的,把一些數據用我們傳統的柱狀圖、餅狀圖表現出來,可能我一個鼠標點上去一個文字,僅此而已,這是大部分圖表做的事情。其實我們想大數據時代這種不僅是呈現,而是通過可視化的方式讓大家更多去解讀數據、閱讀數據的方式,所以我們定位說,我們要讓可視化成為輔助人們進行視覺化思考。
圖說這個產品其實上一段時間了,我們可以看一些案例,這是線上的,比如說這個是新浪新聞曾經有圖說做過的一個專題,他這里面就用到了我們的像陀螺一樣的圖,也用到了這種堆積的折線圖,這樣就不用你寫代碼,你只需要在圖說里面做好圖表嵌入到自己的頁面就行了。
我們就從時間、年齡、省份、通報單位、原因和單位類別、人物關系的維度,全面梳理了從2013年1月至2014年,全國廳局級以上落馬的官員,當時數據量很大,但是現在數據量更大,你通過看這一個表,整個當時的情況就能得到一個比較感官的認識。
我們同時還支持在一個圖里面我們去做這種度堆積,比如這是一個訪問來源,我們可以把搜索引擎的,比如說這個紫色搜索引擎這塊,然后我們把一些其他的廣告類的,營銷帶來的,但是這里面又可以細分成是郵件還是聯盟廣告、還是視頻廣告,通過這樣的方式能夠把數據信息展現的更加直觀一些。
這是2013年的一個作品,也就是說我們的實驗室成立后不久就做了這個作品,大概介紹一下背景,2013年的10月23日、22日,那天早上10點多,在青島那邊發生了一次管道爆炸,它的起因是什么呢?它的起因是這樣的,就是說這個輸油管道從居民區的底下穿過,發生漏油了,漏油以后這個油漏到了污水管道里面,變成了油氣混合物,遇到了明火,爆炸了,導致了62人死亡。
推薦幾個公號,分享一些跟可視化數據有關的內容,第一個是我們實驗室的公號,第二個是全球深度報道網,是港大的公號,第三個大數據新聞,是武漢大學的公號,復旦新是復旦大學的公號,下面是騰訊ISUX和IXDC。
這也是百度遷徙的例子,我們用到值域漫游的東西,我們通過調值域貢獻,只是看到一些我們想聚焦的區域。
我們還看到說周濱往這邊還有一點線,我們看一下興鼎電力,興鼎電力是周濱賣出來的賣給漢龍集團,漢龍集團是劉漢的。漢龍集團底下有一個叫做四川阿壩州九鼎山的旅游項目,這個旅游項目是什么情況呢?它是一家叫四川超越的公司賣給它的,這個四川超越公司是誰的?是黃婉的,周濱妻子的,通過這個我們就反反復復的把細節梳理清楚。
喬宇:謝謝旭寧,謝謝黃老師。
大家看比例,哪個部門,你看我把最多幾個部門突出出來,什么部門在用車比例最高,例如國家事物管理局,利用率最高,因為主要負責領導用車的。出國哪個部門最高呢,商務部、國家體育總局。接待,哪個部門比例最高,宋慶齡基金會、對外友好協會,如果你在這里上班的話可能每天就得忙著請客吃飯,我認為這個其實也是工作范圍嘛,你從名字看就是干這個的。但是你如果不做平均的話,你光看總量不見得準確,我們再看平均,每輛車花了多少喊,還是事務管理局,花的錢最高,這個可以理解。還有看人均的情況,人均出國的費用最高的居然是國家局,我也很了解,我就去了解,他們說把2012年有些錢漏了就挪到了2013年去了,造成2013年特別高,比別人高幾倍,這也算一個原因,萬事都有因。當我們做這些事情的時候我們不會預設一個結論,他應該是什么樣的,我們會看事實,然后我們才知道到底是什么,而且不同的人能夠從這些數據里面看到不同的東西。
我們先介紹一下財新傳媒,我來自財新傳媒。財新傳媒是一個公司,包括了財新網還有4本,我們現在說財新網,當然除了PC上的網站以外還有手機上的網站、還有APP、還有公號、還有微信賬號等等,這些我們會通過不同的渠道去發布東西。之后我們是有4本,《財新周刊》、《中國》、《比較》,還有一本英文刊。有些人對我們稍微了解一點,又不太了解的話,會以為我們這時一個傳統公司,但實際上是這樣的,最早這個團隊確實是做傳統的,實際上我們已經在新的上走了很久了,現在我們每天80%都是原創內容,可以說我們網站上所有的內容都是原創的,其中80%的內容都是發表在網站,只有20%的內容是發布在平媒。
第二個特性是數據視圖。我們在做很多圖表的時候,大家在網頁上看到很多圖表的時候,其實我們看到的是這樣一些表格,其實對于前端工程師來說,我們在看這個表格的時候拿到的是所有的數據,有的用戶看到這個圖表的時候可能希望把這個圖表背后的數據到自己的Excel或者怎么樣再去加工,傳統的圖表沒有這種能力,但是ECharts提供了數據視圖的能力,我們可以把數據展示出來,就可以把數據拷下去自己用。
這個是今年我們的時候做的一個KPI,KPI這個詞可能在互聯網公司很經常用,我們講了一下李克強的KPI,其實這個話題是很難講的,比如事實上考察李克強只能由全國負責,但是我們從普通的角度也可以給李克強去年的工作打一個分,從這個角度出發做了一個他的KPI,比如去年P完成的情況怎么樣,比如土地污染、污染是什么情況,用這種方式呈現了一下,還是有一個簡單明了的效果。
接下來有一個作品,給大家舉一個例子,關于搖車號的作品,我們這個作品是去年6月份做的,當時6月份搖車號的命中率是1/137,你把它作為新聞報道其實沒有什么可說的,一句話就說完了,這個事怎么辦呢?我們就要把這個展示給大家。說到1/137大家就這么一點,如果我再形象一點,1/137,就意味著麻將你把麻將扔掉三張花牌,然后你摸吧,把其他的花牌看誰摸掉。還有,把這個代碼放進去,讓你試一下哪年哪月能搖到,大家就試了一下,1/137一年搖6遍,意味著你得搖22年,在座的各位22年搖到車號就算好運了,這才是。得讓大家去體驗啊,大家就去體驗吧,真的去搖吧,有人很開心搖完了,我明年就中了,雖然說瞎過癮,很高興,他會往外分享。有的人一搖,50年都搖不中,非常的沮喪,也很高興,也要往外分享,所以這個事就分享出去了。
除了這個我們可以看費用榜,我是把這幾十個,把這90多個部門的所有數據全部給你排出來,再拿一個圖形讓你去看,這樣你看起來會很方便,否則它就常枯燥的數據,然后我再按分類走,按照用車、出國、接待等等,然后可以看每一年,這樣的話你可以非常方便的查詢。這個依然是一個數據庫,只不過說我是用可視化的方式來呈現這個數據。
現在國際國內都是大勢所趨,相信在座的所有親們都跟我或者我的小伙伴們一樣,面臨著轉型的壓力。我就想,我們能不能和所有朋友們一起,集合大家的力量、順勢而為、不斷的嘗試和不斷的改變,聚小而形大,一起向著風口前進,一起去爭當那只豬吧。
下一個特性叫動態類型切換。我們知道在這種可視化里面有很多很多的數據圖表,柱狀圖、折線圖、餅狀圖,不同的圖表類型其實它對數據的表達是不一樣的,比如折線圖表達的是一種趨勢,柱狀圖表達的是一種對比。我們有的時候,特別是做可視化設計的時候會很頭疼的一件事情,我有一塊數據,我到底用什么形式來表達呢?有的時候我特別想表達一種趨勢,但我覺得這里面也有對比的關系,那怎么辦呢?可能我們要畫兩個圖,但是我們的這個界面是有限的,裝不下兩個圖,所以ECharts可以做到的一點就是動態類型切換。我雖然只有一份圖,我可以做的事情是,這里我們可以把它切換成折線圖,從剛才的柱狀圖看到的可能是周一到周日,可能周一我們能夠知道它的異向會多一些,慢慢變化,但這個趨勢當你用折線圖的時候會更加的清晰。同時我們還可以做一件事情是說,堆集,我們可以切換成堆集的圖,能夠看到它所有的變化趨勢。這是第一種。
這種做有什么好處呢?他還有一個,其實好多人真的也沒有那么多的耐心去把整個都看完,但是當他看到這么一個圖的時候很驚訝,原來這個案子是這樣的,其實就已經達到非常好的效果。
這本書《最簡單的圖形與最復雜的信息》,它的作者是華爾街日報的圖表設計總監,華爾街日報是在,因為他一直都在做財經,所以他在圖表這方面是積累了非常多的經驗,也常的準確,這里頭會告訴你,很多事情應該怎么做。
還有一個拖拽重計算很厲害,比如說剛才志敏也提到“雙十一”這個東西,這可能就是某家“雙十一”的數據報告,11月的,因為有“雙十一”在,所以我很難看到,除了“雙十一”這一天其他時候的數據表現。這個時候如果你用ECharts做的話,你可以很方便的把“雙十一”這天的數據拖出來,就可以看到其他天的趨勢了,這是我們的第一個特性,拖拽重計算。
我剛才給大家演示了4個PC上的作品,接下來我們來給大家介紹其他的。接下來我要講在手機上呈現數據新聞,它跟在PC上的數據新聞是有一些區別的,就是說,第一,我們要看理由,為什么我們要在手機上去做數據新聞?因為第一,它受眾廣。這個很好理解,現在大家都把錢花在手機上了。第二個,是易。因為在電腦上做這個東西很麻煩,你必須把它分享出去,你只能通過郵件、微信之類的方式,但是你如果在手機朋友圈一分享就出去了,所以起來就很方便,這個非常非常重要。
主題:讓你的數據會講故事
劉葉:大家好!我是新華網的劉葉,首先要感謝在我前面的三位老師給我們介紹的精彩的觀點和經驗。今天我想給大家分享的是新華網在做數據新聞的時候我們經常遵循的一個原則和我們在這方面的一個思考,就是度的數據視角下的新聞的表現。
但是移動公司只有移動手機的分布,電信只有電信手機的分布,而聯通也只有聯通手機的分布。如果說我們的部門,由部門來出面,從那三個運營商的手里把這些數據都歸攏到手里,實時的話,其實它能夠起到非常大的作用,就是說它可以知道隨時什么地方人最多,如果早知道的話這個是可以避免的,就不會發生了。所以這個是一個可視化的案例,同時這也是個大數據的案例。為什么呢?這里頭這張看起來不復雜的圖,它其實里頭包含了幾萬個人的坐標,那么我們也都知道,如果我把幾萬個人的坐標,我們把它打成一張表格打印出來,其實我們什么都看不懂,我不知道任何規律,但是我把它變成這么一個熱力圖的方式以后,是個人都能看懂說哪里的人多、哪里的人少,所以這個數據可視化是大數據分析里頭的一個很重要的手段,這也是為什么今天大數據跟數據可視化會被混在一起的原因,大數據跟數據可視化根本不是一回事,不要把它混在一起講。大數據講的是我們怎么用大量的巨量的數據怎么去搜集利用和分析它,而可視化是其中的一個分析方式,和數據挖掘方式是怎么去展現這些數據,所以它是兩回事,這個我們可以分清楚。
互動圖表跟信息圖最大的區別是什么呢?信息圖有兩種人就可以完成,一個文案、一個設計就可以完成,但是如果是互動圖表的話,它還缺一種人,寫代碼的人,程序員,這個是最大的區別,他需要去完成。互動圖表它的發展其實是最近這四五年的事情,09年大概這個點開始,為什么呢?為什么這些年才能這樣發展呢?幾個原因,一個,因為這個萬億它得借助于網絡,所以以前比如說網速不夠快,什么都不太好辦,這是第一個。第二個,因為它里頭需要用到很多繪圖什么之類的功能,這個必須是要HTML5才會支持的比較好,有的HTML4就可以。原來計算機運算能力也比較差,所以很多東西畫不出來,這幾年技術比較成熟,網速也快了,這個東西就可以畫出來了,所以這也就是為什么這個互動圖表這幾年會發展比較快的原因,也引起了很多的關注,這是互動圖表,所以這是一個基本的概念。
首先我們新浪新聞目前在做的數據可視化的一些東西是這么一種情況,40%是所謂靜態的信息圖,大家目前可以看到我們的圖解天下,是我們的一個品牌欄目,當然我們圖解天下從2014年開始也推出了一個自己的系列人物,叫小明,但是現在我們用了小明之后就發現各大都開始用小明了,我覺得小明太累了,30%是PC交互,30%是移動交互,就是我們針對移動端的產品。
黃志敏:我簡單說一下,我是這么看這幾個問題。第一個,成本。成本確實是,做可視化的東西成本會稍微高一些,我覺得這個沒辦法,但是成本高一點,如果你處理得好,當然回報也會高一些,就是引起關注度會大一些,但是確實有平衡的問題,就是說我們也做了很多作品,但是我確實也不是說每個作品都會引起很多關注。有的作品我們可能自己預期也很好,接下來也會失望,所以我覺得這個好像也沒有什么特別好的辦法。而且這個東西怎么說呢,其實可視化它是解決了一個展現的問題,其實還有一個問題是的問題。
這也是一個力導向圖的例子。
我們就以比如“中的”看信息制作過程。首先前期是一個編輯參與的過程,我們要設定主題,我們究竟要做什么,為什么要做這個,設定角度,就是這個人我們能怎么去做,下一步就是編輯去做數據挖掘,其實這個我們還屬于比較原始的狀態,其實就是編輯可能去國圖,國圖是一個非常好的寶藏,其實好多編輯可能都忘了挖掘這塊了,但是它常好的東西,里面有特別全的數據,基本上你無論查什么,不管是圖書、或者是其他的,只要建國之后有的東西它都會有,當然建國之前的它也有。把數據整理出來,設計師進行可視化加工,這個優點是以編輯參與為主,易操作,編輯主導性會比較強,他的選題、判斷力都會發揮的比較好。缺點就是太簡單了,這種東西確實比較簡單,我們也在思考這個問題,呈現形式上確實比較單一。
嘉賓:
這個看有什么問題?反了吧,一眼看出來了。還有呢?這個到底說的是什么數不知道,閱讀量是什么閱讀量,討論量是什么,粉絲是誰的粉絲,都沒有吧,數據來源是從哪兒來的,也沒有吧。反正我還沒學會做,但我學會看,我就看那些圖我知道什么是爛圖。
這個是ECharts,其實在介紹ECharts可能大家更多的是了解ECharts有什么樣的能力,真正讓各位去用ECharts是不現實的,可能你們也需要在公司內部像黃總一樣可能建立一個這樣的實驗室或者這樣一個流程,也有前端工程師去做。但是這是一個問題,不能說什么東西都指著程序員,特別是前端程序員可能如果沒有招聘過不了解,招一個前端工程師是特別困難的事情,我去年招了,我面試面了160多個人,最后只招了3個人,這個市場常困難的事情。
還有一個圖表,這份數據是財新網報道的一個數據,是美國包括一些中東國家他們的一些關系,這個圖,從理解上可能有人不太容易理解,它表述的比如說,我看沙特,我可以看到沙特跟一些國家他們有什么樣的關系。通過這個圖,我們可以慢慢的去了解誰跟誰的關系,其實同樣一份數據我們可以換一種解讀,我們可以看到在這個關系網里面,誰可能在這個關系網里面它更復雜,跟更多的國家有一些關系。這是動態類型切換,同樣的數據用不同的類型來呈現。
這個是我們圖說的程序員給他爸爸自己做的一個血小板的變化情況記錄,也可以用來記錄自己家人的一些東西,這個就是圖說,就是希望用圖說和ECharts分別給會寫程序的人以及不會寫程序的人都帶來做可視化的能力和工具。
不僅僅這樣,如果我看到這個圖表的時候,我會假設,比如說這個地方利潤、支出、收入,如果這個數據在畫圖的時候寫錯了怎么辦,可以在數據視圖里點,把這個地方做一個修改,刷新,我們可以看到,你可以在圖表中做的數據馬上被調整。
剛才簡單介紹了一下我們新浪新聞做的嘗試,下面也講幾個困惑的問題,其實也是給黃志敏老師提個問。其實我們講數據可視化這塊的東西,說一個非常實際的問題就是成本,包括人力和時間上,我覺得這個東西它跟普通人,跟我們原來意義上講編輯做一個東西,編輯可能需要幾分鐘就完成了,但是這個花費成本多,比如它需要用設計師,需要前端,需要編輯也要參加,人力和實際成本是一個問題。另外,內容如何挖掘,如何挖掘、從哪兒挖掘這些我們可以做的角度、可以做的點。第三,復用性。現在發現我們做一個東西,可能的情況下只針對這個特定的事件有效,但是如何復制到另外一個事件上,如何復制到另外一個報道上,這是一個問題。第四,工具。這個問題不用講了,大家都說了一些應用的數據可視化的工具。主要是前三個問題,請黃老師給簡單解答一下。
我們在去年也發布了一個2.0的時間我們增加的時間軸,并且是支持這樣的動畫的一個效果。時間軸其實也可以跟不同的一些圖表去百搭,比如像這里我們用了人均P這么一個地圖,各個省份的人均P是時間軸在一起,我們就可以看到一些東西,比如說我們通過值域漫游,我們只顯示把我們要看的數據聚焦在這個區域,我們播放時間軸,我們可以看到的中國所謂拖頻的軌跡。先從沿海地區,慢慢的往里面。
大家可以試試看,就像大家都會寫影評一樣,我不會看,但是我會寫。大家看這里面,不知道什么是熱詞,這個是和相關的,還有呢?每張圖上可以找到很多問題,Y軸很奇怪,這些數我理解應該標在邊上的,Y軸的指標單位也沒有,這個隨便能找出幾個毛病來。
先講一下度是什么,我想引入兩個在藝術表現上的概念來向大家介紹度。首先是我們可能現在在新聞表現上有一個經常用的,就是說我們在新聞事件里頭最具特點的一個切面,從這個入口來表現新聞。這個是我覺得像埃及的方法,因為我們看埃及的壁畫,這個人常扭曲的,她的眼是正面的,臉是側面的,肩膀是正面的,但是兩臂和雙腿都是側面的。因為埃及人覺得,通過這樣的組合能更加表面他們心目確的世界的這樣一個看法。
之前林峰做ECharts的時候特別給大家的動力就是說,他知道他要的ECharts做成什么樣子,他發現用戶用ECharts的時候,用出來的場景遠遠超出他的想象,用戶的創意常牛逼的,所以說我也希望大家在用ECharts的時候,不用局限在我們所提供的那些圖表,你可以發揮你自己的想象力,去做你需要的可視化的一些案例。
所以說除了ECharts我們還做了另外一個東西,叫圖說,不知道有多少人聽說過這個東西,還是有一點,非常少。為什么要做圖說呢?其實我們是基于這么一個分析,就是很多人都有這種數據的分享,今天到場的各位可能大部分是的朋友,所以說大家的基本上是在那個部分,就是我們有很多公開的這種數據,然后我們要做這種分享,可能在我們公司內部我們會經常接觸到這樣的用戶,比如說我們有個部門叫銷售監察部,他們要做的事情要給老大匯報每個月公司的一些銷售監察的數據,他們不會寫代碼,但是他們又不希望用PPT、Excel的形式,他們找到我們怎么辦。后來我們圖說做了以后他們是我們最的用戶之一,他們每次用圖說做了發給老大。
我覺得是我們發現的一個比較好的數據庫,尤其是做新聞來講,新聞我們在中國空間很大,當然我們財新網的老師是很厲害的,關于或者是很多新聞挖掘都是很厲害的,我們一般的大眾是達不到這種情況的,一方面是沒有人給你料,第二方面,你也是拿不到這些料,這造成了就是說,你要做新聞你有很大的來源不足的問題,但是能給我們補充好多這個東西,它是一個特別大的數據庫。比如說從1948年、1947年剛剛建立時候一直到現在,每天的數據都有,我們都可以查到,每天發了多少篇文章,文章里面是什么內容,通過一個整體形成非常好的解讀中國的圖表。
我們想創作這樣的新聞作品一定要遵循兩個原則,一個是它的準確性,就是我們想盡量準確的,這也是我們官媒一向的立場,一定要準確的而且全面的來闡述這個新聞事件。另外就是說,我們希望能夠使讀者,不光是更輕松的獲得這個新聞的信息,而且能讓他們獲得更深入的知識,這樣無論是從剛才我講的正確性方面,還是說在深方面,來說度的數據新聞我們覺得都是必要的。
我們在去年也根據用戶的反饋支持了一些這種商業BI用到的圖表,左邊是一個汽車上的儀表盤這么一個東西,一開始我們沒想到為什么會有這樣的需求,后來我們發現就是可視化的一個案例,就是說同樣85%,如果你只是用了數據或者用一個什么柱狀圖,人們感覺不到這種急迫感,但是當你用儀表盤的時候,當你到85%,就像踩油門上的比較猛的時候,會有心跳得感覺,就是可視化的力量。
黃志敏:大家好!這星期不知道為什么分享比較多,這是我這星期分享第六場,今天早上還有另外一場,不知道為什么。我就把我這邊的一些經驗之類的跟大家分享一下,有經驗、有教訓、有收獲,跟大家分享一下,希望對大家有幫助。
希臘式,希臘時代的時候通過短縮法,人們終于可以通過立體的方式來展界,可以通過各種視角來觀察,就像我們觀察真實世界一樣,我們可以引申出一個觀點說,在數據新聞表現力,我們可以把不同視角的數據、不同維度的數據有選擇的組合起來說明不同的新聞事件或者不同的新聞問題。
我們先看第一排,這幾十個人我把它分成幾組,劉漢不好分組,放在外面,這是的兩個兒子,包括的妻子等等,周家。第二個是石油氣被調查的官員。第三個這部分是俞剛和談紅,還有的秘書。還有四川調查了很多人,還有一部分。我把它分開了,用紅色的線條表示之間的關系,這里有紅色的線條,紅色的線條表示說他們之間是直系親屬,我把直系親屬連起來。紫色的線條表示什么呢?誰是誰的下屬。白點出發的方向,白點往那個方向走,就說明他是他的下屬。第三個情況是秘書,六根橙色的線表示周永的秘書,我用點跟線就把他們之間的關系表現出來了。
這是一個人員組成的情況。我們是2013年的6月份開始介入這個領域,然后我們開始學習請人來講課等等,然后到10月份的時候,我們成立了我們的數據可視化實驗室。這個實驗室分布在不同的部門,它有三種人組成,記者、編輯,還有設計師,還有程序員,由這三種人組成,這三種人分布在不同的部門,我們這個實驗室是一個虛擬的實驗室。大家跨部門工作,然后根據不同的需要把他組合在一起。記者、編輯負責這個文字的處理和數據的搜集,設計師來設計這個內容,程序員來寫代碼。實際上這里頭還有一個角色,我們要把它標出來,是由這些人輪流擔當的,就是它還必須有一個類似產品經理的角色,去決定說這個產品最后會做成什么樣子。
時間:2015年3月27日(下午)
我們可以看一下下一個案例,下一個案例其實這個不是一個新聞,這是一個商業作品,是我們幫阿里那邊做的一個可視化作品,簡單來講,它當時去年“雙十一”業績非常不錯,他們提前就知道很不錯了,所以就提前找我們說,你們到時候幫我們做一個,把這些數據傳去,我說好啊,我們就幫你們做吧。所以我們就幫他做了一個,我把它錄成了視頻可以給大家看一下。
我們也做了一些,除了傳統剛剛提到的圖表,我們做了一些吸引眼球的,首先第一個就是,百度遷徙,相信大家都看到過,去年和今年央視都有報道,這就是我們基于ECharts做的一個在地圖上做的比較炫的一些效果。
祖明:大家好!我其實做過很多分享,但是關于ECharts的分享還是第一次做。為什么呢?因為之前所有ECharts的分享都是由我們ECharts的創造者林峰,大家可能對他熟悉一些,因為他前段時間追求夢想去創業了。ECharts團隊當然我們會繼續做下去,今天志敏也跟我交流,接下來ECharts怎么辦,我們會加大力度,會招更多的工程師加大我們產品的迭代速度,也請大家放心,ECharts會繼續的免費開源給大家提供更好的服務。
基于這個想法和大家的努力,我們的螞蟻邦終于在2015年的春天誕生了,這是一個專注于傳媒創新和傳媒人創業的一個平臺。從今天起我們將在螞蟻邦這個平臺和大伙分享各種前瞻性的、有價值的行業知識和信息,互通最有利的行業資源,針對傳媒業的創新項目和傳媒人,我相信在座的小伙伴們一定有的這種創業項目,我們逐步會提供展示平臺和指導服務。
當時出于兩個考慮,第一,讓網友更容易、更方便、更可靠的接觸到信息,因為說實話,時政新聞,我們現在說反腐新聞,甚至哪怕一些新聞,是很枯燥無聊的,大家誰會每天去看看比如說習總干了點什么、李總干了點什么,大家對這些信息接受起來是很困難的。還有一些數據,比如P,比如說投資。我在2008年第一次聽到4萬億這個數字的時候,我當時反應半天,我說4萬億是一個什么數,我到今天才反應過來。但是我覺得如果有一個很簡單的圖示或者一個圖解能告訴大家,4萬億比如說相當于某一個國家的幾倍的P,比如相當于英國的幾倍、美國的幾倍,我們就能很明顯的了解到4萬億投資是多么巨大的規模,這是讓信息更通暢的流動、讓網友更容易接受。
我們看到這有5個APP,這5個APP都是我們自己開發的,我們現在有30多個人的研發團隊,分為幾個部門,一個移動部,一個網站部,一個創意部,創意部主要做設計,還有一個叫數據可視化實驗室,這個實驗室是一伙今天我要重點分享的內容,這些APP也都是我們自己開發的。
第三個復用性的問題,我們盡可能的,我相信你們也會這么干,你做一個事情盡可能的變成一個模塊,像我們做青島的項目,我們也把它模塊化,后來是在好幾個類似項目里頭,地震什么的,我們都反復用,我認為這件事情復用性大家都會盡量去做。但總的來講你要做成可視化,成本比文字肯定會稍微高一些。
接下來我們整個2015年我們對可視化這塊的投入力度會加大,也希望,永遠我們畢竟是程序員,加上百度,它其實不是一個行業,它是做互聯網的,做搜索的,做技術的,也希望更多的聽到大家的需求,大家希望在可視化領域得到滿足的話可以聯系我們,我也加入那個群里了,大家可以加我微信,也可以關注我們ECharts的官微,也可以直接發郵件,然后聯系到我們,謝謝大家!
我們快速的跳到一戰以后,到30年代以后,因為隨著歐洲那邊的局勢變得緊張,越來越多的獲者出現在美國,我們可以看到美國的這根線變得突出了,這是一個非常非常明顯的跡象在這里。1939年二戰爆發,我們可以看到1940年到1942年這三年是沒有做評選的。到二戰以后我們發現一個新的現象,整個科技的中心從歐洲挪到了美國,非常明顯,二戰以后美國的獲者非常非常多,同時也有一些第三世界國家的,包括亞洲、南美等等一些國家,都開始有人獲。所以從這個我們就可以看到整個獲者分布的情況,這其實也是一種數據挖掘,就找出這里頭的獲者的規律。
所以這個項目里面看這么一個頁面,這里頭包含了大概3萬字的信息量,非常豐富的信息量都包含在這么一個頁面里頭。我們做這個項目的時候,還有一點就是說,我們做這個項目,如果我只放在財新網,我財新網的訪問量沒那么高,所以我做這個沒有那么多人會看到,這種情況怎么辦呢?我拿來跟門戶網站合作,就包括說像跟新浪合作,包括跟網易合作,把這個項目拿來跟大家合作。合作的話怎么辦,因為原來這個文字合作就不太好辦,我把稿子授權給你,大家就不來我們這兒看了,我給你高價你又不愿意給,這個不好談。這個比較好談的是什么?我把這個代碼給到門戶網站上,用戶看這個東西的時候他是在門戶網站上看的,所以他在消耗了大量的時間,后來我看了數據,用戶在門戶網站上平均每個人在這個項目上消耗半個小時看這個東西。但是我也先說清楚,這是有我的推廣資源的,這有我的LOGO,文字介紹前面也有我網站的名字,還有我的域名,這個是我的回報。
我需要跟大家分享的東西就這么多,這里頭是我的聯系方式,大家掃一下是可以把我的聯系方式存下來。如果大家有問題的話可以跟我微信聯系,加我微信的同學就麻煩說把你們的全名還有你們的工作單位都寫到里頭,這樣我才能方便標注。
我們再看下一個作品,做數據新聞其實有些時候不一定是一個需要講故事的東西,我們看一下這個作品叫“三公消費”,三公消費是我們經常在提的事情,但是三公到底是哪三公,三公消費金額到底多大,其實我們很多人不是很了解,包括現在控制的到底好還是不好。
接下來我們進入沙龍的第二個環節,叫“百家爭鳴”環節我們希望通過這個環節,引入百家之言,以及更多有代表性的創新型的傳媒產品。
下一個就是移動的交互,從2014年下半年開始,基本上各個門戶也開始推出了以HTML5為交互的可視化產品,其中有相當一部分是數據類。大家比如從地圖上,從柱狀圖上,從整體的情況,了解一下我們國家的錢到底去了哪兒,投資到底在哪個國家。
我們也可以支持這種實時的展現數據變化,如果你是要展現一種,它會實時變化,比如你網站實時PV的變化或者一些股票的實時變化,我們可以支持這樣實時的圖。
這本書叫《圖解力》,這本書是一個日本人寫的,因為他是做了幾十年的信息圖,一個老頭,從畫地圖那時候開始,他們當時都是沒有電腦,是直接用手繪的,他會告訴你說怎么樣準確的用圖形去表現你要展示的內容,這都常好的書,都非常好看。
他們有什么區別?第一,顯示面積不一樣。決定有些項目沒法在手機上做,例如這個項目在手機上做不上去。還有,操作方式不一樣。咱們在電腦上我可以用鼠標做非常精準的操作,但是如果是在手機上只能是用手指頭這么去點,所以沒辦法點的特別精細,但是它也有不一樣的就是說,它除了單擊,可能還可以雙擊,然后可以放大、縮小,可以滑動,甚至可以搖動,操作方式就有很大不一樣,所以產品設計時就要求必須不一樣了。另外,它接口也不一樣,在手機上我們除了這個操作接口以外我們還可以調動什么?我可以記錄你的,用GPS記錄你的,我可以錄你的聲音,我可以拍照片、拍視頻等等,很多接口不太一樣,所以能做的事情也不一樣,這都決定了我們產品的設計需要完全不同。
圖解新聞這個欄目我們是從2012年底開始創立,到現在更新了200多期,是主要的可視化形式,其實這個圖解也算是在門戶網站當中做的比較早的一批,之前也嘗試很多形式,比如我們做的數讀,的,中國的小伙伴是友邦還是敵人,這些東西,比如說官員,我們每天都可以看到比如今天有一個官員了,明天又報出來一個,這些都了,當我們把這些數據整合起來發現,比如在各個省、各個年齡段、各個時間段都是有一個比較好的呈現形式,大家都比較了解現在比如說官員他的一種生活狀態、他的一種狀態是什么。
從這兒到這兒,誰持有哪家公司的股份,我用線把它連起來,一看一目了然。這邊有一根藍色的線,還有白點,表示這個是他的子公司。這邊這么一連,底下是的子公司,關系就全部楚了。這里面有一個的線條,的有兩種情況,這個是別人的項目他從這里頭掙錢,另外一個,這里邊是他的公司賣掉了,我都用來表示,說明他只有利益的歸屬,而沒有占有的關系、沒有所有權的關系。你看這兩排,這100多家公司里頭,所有的這些藍色的都是周家直接或者間接持有的公司和獲利的項目,藍色的全部都是,而白色的是什么呢?白色的是在這里頭有一些相關交易的。
我們來舉一個例子,我們每個人都在用手機,我們手機上有多少東西是可視化的呢?假設我現在打開一個APP,我們看一下,手機信號這是可視化的,WIFI的信號是可視化的,這個電量是可視化的,這個圖本身也都是可視化的。例如說我們在生活中不會覺得說一條,如果暢通就都是綠色,堵塞就都是紅色,不是這種感覺,但是我們看地圖看多了以后我們自然而然就獲得了這個概念,說我要前面走這條是綠的,那就說明它的很通暢的。實際上這里頭還有很多別的,例如說它的運營商的標志燈等,這些其實都是信息可視化。所以我們還是這么說,就是說可視化這種東西無處不在的。
我今天主要講兩塊,一塊是我們的嘗試,我會把以前我們做的東西跟大家匯報一下,接著講我們目前做這些東西面臨的一些困惑。
接下來是值域漫游。值域漫游什么意思呢?其實我一操作大家就懂了,我現在鼠標在左邊,有這么一個條,我把它拖一下,我還可以反復拖,其實這個交互很簡單,通過這樣的交互大家可以去解讀數據里背后的一些東西。這個就是大家比較常見的,就是像這種數據區域的收放,比如這個時間連線可以變短、變長,這個大家見的比較多一些。還有像多圖聯動,我可以把K線圖和其他的數據放在同一張圖里,通過他們彼此之間的關系去挖掘數據背后的一些事情。
地點:言幾又咖啡廳
我們線下的沙龍,至少每月有一次;每天我們有微信群里的內容分享和互動討論;每年我們還有至少一場的大型峰會。現在我就想朋友們一起來做一件事,看看你手中的邀請函或者是臺上的這個大屏幕,動動手指微信掃碼加入我們這個群,叫“螞蟻邦-創新訓練營”,入群后創新創業方面您有任何需求、想法和,歡迎在這個群里面發言,我們的管理員曹兢和小花將為大家提供服務。這就是我們群的兩個管理員。當然作為幫主我最最希望看到的情況是,幫內的朋友們可以互為知己,親密的像一家人一樣,螞蟻邦就是大伙的家,在這個家里您可以盡情的發言、拍磚、秀實力,讓我們有品的任性吧。今天的沙龍就是讓各位親們,讓最愉悅的心情體驗最有價值的分享。
下面進入本期沙龍的第一個環節“真知灼見”,首先登場的這位大牛他有著17年的互聯網和移動互聯網的工作經驗,17年,一會兒可以問問多大歲數了,他帶領的10個人組成的財新數據可視化實驗室團隊,至今已發表作品50多件。像“參與搖號小游戲”這樣的產品,僅僅用半天時間就制作完成,在朋友圈一星期內獲得150萬次訪問。目前他正致力于用大數據和可視化推動新聞業的發展。接下來有請財新傳媒CTO、數據新聞與可視化實驗室創始人黃志敏。
它的三種人怎么去合作呢?過去在里頭,設計師跟程序員都處于新聞生產下游,稿子做成什么樣是由編輯、記者決定的,記者寫一遍,編輯把它編出來,已經成為了,再由美編設計師配圖,再由技術人員發布出去,這是一個上下游的關系。所以在新聞的生產里頭,其實這個設計師也好、這個程序員也好,其實他的參與感非常低,或者說最后這個新聞就算引起了很大的轟動、甚至獲,都會覺得這個事其實跟他沒有太大的關系,是這種狀況的。但是自從我們做了數據新聞,這個情況就變了,因為數據新聞本身的特點決定什么,需要這三種一開始大家就一起做深度的合作。
其實我在大概兩個禮拜前接到這個邀請時候準備了很久的PPT,但是后來覺得再怎么準備其實沒有我們之前林峰同學做的這份PPT的內容最完善。
這頁其實講的是剛才黃總也介紹了一些工具,比如說Excel,像ECharts這樣的東西,其實使用場景是不一樣的,我們可能在圖表支持上更多一些,這兩個是完全不同的領域,一個是在本地的文案做,一個是在Web上做,我們可能更實際的比較,跟我們現在業界最流行的商業圖表庫Highcharts比較,他們有的圖表我們都有。最核心的能力,在于我們的拖拽重計算、數據視圖包括大數據能力,最重要的一點我們是免費的,Highcharts是商業是付費的。
我今天講的標題就是“和數據可視化不得不說的那些事”,講講我們新浪新聞目前在數據可視化方面做的一些工作,剛才像祖明老師他們也引用了一些我們做的東西,黃志敏老師也講了財新網的東西,我們新浪新聞為什么做數據可視化這塊的東西。
這個是我們做的幾個PC端交互可視化的一個產品,像解讀薄式江湖,我們現在印象中可能只有,當時出來的時候可能是從2011年,2011年、2012年、2013年是最引人關注的案子,他引人關注不亞于現在這個案子,而且人物關系、戲劇性,還有整個我可以用四個字來形容“波瀾壯闊”,比如說一個耳光、一個茶杯、一個、一個官員的多馬,他跟王立軍的關系、跟薄谷開來的關系等等。
我們大概的流程是這樣的。首先我們會定一個選題,大家一起商量一個選題,說值得不值得做,有沒有新聞價值。之后我們會看說,如果這個選題值得做還有一點,看它有沒有足夠的數據來做,沒有數據沒得可做。如果選題定了,數據沒有問題,我們就大家坐在一塊商量說,我們用什么形式去表現這個新聞比較好。這個商量的事情商量得差不多了,這個設計師就會去畫出一個圖形、一個造型之類的來展示這個,這個時候他畫完以后就得問這個程序員說,這個能不能做,或者說這個開發成本有多高。
很多人用可視化數據寫一些故事、寫一些新聞,或者他想向老板匯報圖表數據,想用更高效的方式,因為他不會寫代碼,也不想用Excel,他也想做一些可視化的數據,他想做這樣的東西,但是像ECharts這樣的圖表背后是什么東西呢?比如大家我看到都很頭暈,每次收到ECharts的問題郵件我頭都很大,我們做“零編程的數據可視化實現+便捷的分享平臺”。
這個我們是不是一個晚上做出來呢?顯然不是,這個我們做了大概三個月的時間,為什么做這個東西,為什么做成這個樣子?我給大家解釋一下。因為我當時就在想就是說,一個6萬字的調查報道,一個是,很少有人耐心的看完。從我們的統計數據就可以看得出來說,越往后的章節看的人越少,這很正常,我們希望有更好的形式去展示。第二個,這個報道里頭有大量的關于人物之間的關系,還有公司之間的股權關系,還有人跟公司之間的持股關系,等等很多很復雜的關系。這種東西說白了對我們來講,就包含了大量的數據。
圖說大家如果注冊以后能看到界面,域名很簡單,就是tushuo.baidu.com,這就是我之前做的案例,操作什么樣的,很簡單,比如我現在要創建一個折線圖,我們這里有很多圖表,折線、柱狀、餅圖,點了以后就到這么一個界面,一個圖表就出來了,我現在想編輯數據,可以直接導入Excel,我可以隨便改數據,我也可以調整很多參數,這也是我們需要優化的地方,這里面太多的東西,名詞比較技術,大家可能在理解上得一邊試一遍才能知道什么東西。比如我們可以去設置一下,比如說Y軸的,比如現在是下,我們可以把它放到去,就跑到去了,也可以設置很多文本的顏色,比如說現在是黑色,我們把它設置變成紅色,應該改成那個顏色。還有包括圖例、工具等等,說實話,我覺得目前這個產品的應用性不是太好,但是相對于寫代碼來說要好很多。當然我們也可以繼續插入一些圖表,我們甚至可以添加一些文字,你可以是標題、還是正文等等方式。
三公消費控制的到底好還是不好,我們從這些數據就可以看出來,這5年下來三公消費壓縮還是不少的,至少中央這一級,用車這塊、招待這塊基本上壓到了1/3,出國漲了一點點,我們應該看到,這里頭工作其實還是做了很多,也是有效果的。這是一個“三公消費龍虎榜”這么一個項目。
這就是一個混搭的例子,把這個餅圖、折線圖、柱狀圖放在一張圖里面。把這種餅圖放在散點圖可以去描述,假設這是什么人群分布,比如在不同的X軸、Y軸上有個人群,人群里面可能還可以分男女或者其他的數據。
ECharts這個產品是我們從2012年的8月份開始做,立項,懷胎9個月,在2013年的6月份發布了1.0,然后在2014年的6月份,去年6月份發布了2.0。在發布2.0以后,ECharts這個發展速度非常迅速,我們在全球的開源社區關注度持續的攀升,大概在2012年的第三季度、第四季度的時候,我們當時又超過了全球其實是最流行的一個圖表的關注度,我們到去年2014年的11月份我們發布了國際版、海外版,發布之后我們的用戶數直接就超過了五六千。
現在我其實還沒有去過青島,但是我對這個地形實際上熟的非常要命,非常清楚什么情況,閉著眼睛都會走,這個是我們當時做的新聞報道這種情況。做這個新聞我們花了多長時間呢?我們花了大概一天的時間,里頭有半天在寫代碼,又有半天時間上傳數據、上傳圖片,還有做一些數據的修正之類的,用一天時間把它發布出去了。
黃志敏 財新傳媒CTO
我用數據可視化可以展示大數據,我也可以展示小數據,我后面給大家分析的這些案例基本上都屬于小數據,不是大數據。
當時做這個報道的時候,我們是有一個30多人的報道組在做這個事情,這30多人的報道組,有3個在青島,大部分人在,還有人在上海、有在廣州,我們怎么協作呢?就靠微信群,大家就在微信群里頭協作,微信群是一個非常好的效率工具,我們做到什么樣呢?除了做正常信息溝通以外,我們做到說,我們的記者在前面趕,他用語音把他要寫的事情說了傳回來,我們后方的人趕緊就把他敲成文字,再編輯審查以后上網,這樣我們基本這個事情在10分鐘之內就能報出來了,就能報出現場的情況。包括像我們的記者在前面趕,跟我們說你到了哪里,我說你不用說,你扔一個給我們就可以,然后我們就可以給他指。這個不僅是新聞展示用的,還是一個工具,非常好用的工具。
這是一個國外的數據,就是國外用戶的手機他的APP的安裝率。這個圖相當于是環形圖和餅狀圖,描述的就是有多少用戶裝了這樣的APP,當然這個圖你也能看到這種趨勢,比如說谷歌地圖裝的比較多,其他的裝的比較少。我們用可視化的方式可以換一種形式的話,可以看到是更明顯的一個變化。
這底下的文字報道,最后全部都是移到,還是在連回我財新網,這樣我也獲得了回報。后來我測算了一下,這部分的點擊率,就是他的大概能達到1/5。我覺得挺好,這個回報還是蠻高的,所以基本上是,我們是用這樣一個方式達到了雙贏,就是很多人也看到了這個項目,然后門戶網站也獲得了好處,我們也獲得了好處,當然我們自己的網站也有自己的訪問量。所以這樣的網站我們統計下來,大概一周多的時間有400萬的訪問量,并且獲得了很大的一個關注。當時微博有人轉發這個,結果微博被轉發了5萬次,被評論了4千多條,而且評論非常好。
在國外他們還有這么一種說法,因為這種東西沒有一個絕對的定義,國外他們有的,例如說英國衛報。為什么我訂英國衛報呢?就是說數據新聞這塊國外誰最領先,紐約時報、英國衛報還有美國的公共MPR,等等這些是比較領先的。例如說衛報,他們認為說這個只要是從數據里頭挖掘出來的新聞,就算寫成文字報道那也叫數據新聞,它有這樣一個定義。如果按這種定義的話,以前像那種說,我看財報,然后挖人要做假賬,這種事你也可以說是數據新聞,這是他們的定義,而我的定義是這樣的,我認為這個必須用可視化的手段展示出來才叫數據新聞。
你們看一下,這個17.74,這個8.76,你們有沒有發現它高度有點問題,正常它大致應該是它的一半,現在顯然不是嘛,這種都常低級的錯誤,因為低級的錯誤會導致你產生錯誤的理解。包括在這種圖里頭箭頭是不需要的,沒必要用箭頭的,如果為了好看,甚至這個軸都可以不畫的,如果我要好看,這個應該寬一點,它的間距應該是這個柱子寬度的一半。后面這種好不好看的東西,見仁見智,有的東西硬傷是不能犯的,犯了這個東西做的就不對,會導致你,或者你產生錯覺,這是一個的案例。
祖明 百度復合搜索部前端團隊經理
我們再看下一個,這個圖有什么問題呢?有人說沒有排序,看起來這邊好像排序了。這些東西里頭,百分比到底是什么意思?是這個省份發議論的人數占全國的百分比呢,還是說這個省份發議論的人數占他們省的人口的百分比,沒人看得出來吧。如果說我們講的是山東占全國的8.16%的話,那種意思其實我們可能該用一個餅圖會比較好理解,但如果我們講的是山東有8.16%的人關注,而有13.26%,如果這樣的話我們用一個柱形圖會比較準確。這樣的話其實你是沒有辦解的,最后還莫名其妙弄了這么一個東西,又沒有關系,最后還導致了擺了遍。我們做數據可視化,一張圖拿出來所有的符號、顏色、數字、大小等等都必須是有含義的,任何一個東西沒有含義都不行。
做這個項目給我們帶來了幾個非常好的收獲?第一個,這個報道,連同其他相關的報道,幫助我們網站當天是創下了財新網訪問量的高點跟歷史紀錄。第二個好處,這個報道我們在去年獲得了亞洲新聞,就是這個作品。并且我們的程序員因此獲得了新聞,這個在中國新聞史上我認為是第一次,因為以前拿新聞都是記者的事,最多就是攝影師的事,從來沒有程序員拿過新聞,我們這是第一次,第一次有程序員可以拿新聞,是一個沒有受過任何新聞教育和培訓的程序員拿到的。
盧旭寧:大家好!也謝謝剛才黃老師、祖明老師的分享,也謝謝剛剛喬宇的介紹。她叫我小朋友,但是面相看她很明顯要比我小很多。
我們的記者當天趕到了現場,并且拍回來大量的現場照片,我們就把這些照片放到了Google地圖上,做到了這則新聞報道。前面我會把這個新聞從大到下,讓大家了解山東在中國的哪個,青島又在哪個,最后爆炸點又在青島市的哪個。我們可以切到衛星圖,我們可以看到說,這個紅色地方大致就是爆炸的中心點,底下這一片都是居民區,而這塊密密麻麻白色的東西都是油罐子。所以我們直接就能看出來就是說,你想當地有多不安全,那些人就生活在火藥桶邊上,這根藍色的就是輸油管道。這個地方其實1989年的時候就已經發生過一次大火。的就是被掀開的污水管道。我們現在能看到一些紅色的小球,標了一些數字,就表示我們在這個地方拍了一些新聞照片,并且拍了多少張。
說到官媒,大家習慣認為,官媒有很多資源、有很多優勢,內容都OK,都很好,但是可能會意識到,官媒在數據呈現上、內容呈現上,比我們這樣子的門戶網站或者財經這樣的后起之秀差一些。最近半年我們看到了一個比較有特色的官媒,那就是新華網,他們實際上在數據新聞做了很多的探索和努力,據說他們做的數據新聞的條數應該有上千條還是數千條我忘記了,量還是蠻大的,下面有請新華網的劉葉上臺為我們大家分享。