摘自《誰說菜鳥不會數據分析》第一章
Mr.林看到小白斗志昂揚的樣子非常高興:別光說不做啊,要成為一名優秀的數據分析師,并非一件容易的事。雖然所學的專業與數據分析不相關,但你可以通過工作中的實踐學習數據分析,需要付出大量的時間和精力,不經一番寒徹骨,怎得梅花撲鼻香?
下面,我給你介紹一名合格的數據分析師需要具備的五大基本能力和素質。
1、態度嚴謹負責
嚴謹負責是數據分析師的必備素質之一,只有本著嚴謹負責的態度,才能保證數據的客觀、準確。在企業里,數據分析師可以說是企業的醫生,他們通過對企業運營數據的分析,為企業尋找癥結及問題。一名合格的數據分析師,應具有嚴謹、負責的態度,保持中立立場,客觀評價企業發展過程中存在的問題,為決策層提供有效的參考依據;不應受其他因素影響而更改數據,隱瞞企業存在的問題,這樣做對企業發展是非常不利的,甚至會造成嚴重的后果。而且,對數據分析師自身來說,也是前途盡毀,從此以后所做的數據分析結果都將受到質疑,因為你已經不再是可信賴的人,在同事、領導、客戶面前已經失去了信任。所以,作為一名數據分析師就必須持有嚴謹負責的態度,這也是最基本的職業道德。
2、好奇心強烈
好奇心人皆有之,但是作為數據分析師,這份好奇心就應該更強烈,要積極主動地發現和挖掘隱藏在數據內部的真相。在數據分析師的腦子里,應該充滿著無數個“為什么”,為什么是這樣的結果,為什么不是那樣的結果,導致這個結果的原因是什么,為什么結果不是預期的那樣等等。這一系列問題都要在進行數據分析時提出來,并且通過數據分析,給自己一個滿意的答案。越是優秀的數據分析師,好奇心也越不容易滿足,回答了一個問題,又會拋出一個新的問題,繼續研究下去。只有擁有了這樣一種刨根問底的精神,才會對數據和結論保持敏感,繼而順藤摸瓜,找出數據背后的真相。
3、邏輯思維清晰
除了一顆探索真相的好奇心,數據分析師還需要具備縝密的思維和清晰的邏輯推理能力。我記得有位大師說過:結構為王。何謂結構,結構就是我們常說的邏輯,不論說話還是寫文章,都要有條理,有目的,不可眉毛胡子一把抓,不分主次。
通常從事數據分析時所面對的商業問題都是較為復雜的,我們要考慮錯綜復雜的成因,分析所面對的各種復雜的環境因素,并在若干發展可能性中選擇一個最優的方向。這就需要我們對事實有足夠的了解,同時也需要我們能真正理清問題的整體以及局部的結構,在深度思考后,理清結構中相互的邏輯關系,只有這樣才能真正客觀地、科學地找到商業問題的答案。
4、擅長模仿
在做數據分析時,有自己的想法固然重要,但是“前車之鑒”也是非常有必要學習的,它能幫助數據分析師迅速地成長,因此,模仿是快速提高學習成果的有效方法。這里說的模仿主要是參考他人優秀的分析思路和方法,而并不是說直接“照搬”。成功的模仿需要領會他人方法精髓,理解其分析原理,透過表面達到實質。萬變不離其宗,要善于將這些精華轉化為自己的知識,否則,只能是“一直在模仿,從未超越過”。
5、勇于創新
通過模仿可以借鑒他人的成功經驗,但模仿的時間不宜太長,并且建議每次模仿后都要進行總結,提出可以改進的地方,甚至要有所創新。創新是一個優秀數據分析師應具備的精神,只有不斷的創新,才能提高自己的分析水平,使自己站在更高的角度來分析問題,為整個研究領域乃至社會帶來更多的價值。現在的分析方法和研究課題千變萬化,墨守成規是無法很好地解決所面臨的新問題的。
聽到這里,小白就掰著手指頭算自己符合幾條優秀數據分析師的素質和能力。
Mr.林繼續說道:這些素質能力不是說有就有的,需要慢慢培養形成,不能一蹴而就。
商業智能技術未來發展趨勢
作者:CIO時代網
伴隨著全球經濟一體化進程的加快,國內企業將面臨來自國際大型跨國公司的巨大競爭壓力,企業所處的環
境更加復雜多變,市場競爭趨向白熱化,企業在不斷壯大自身的同時,其組織結構也變得越來越復雜。企業要想
在這種環境下生存和發展,就必須高效、正確的響應各種狀況,這時候就需要一種手段來幫助企業對經營過程中
產生的數據進行收集、整理、分析以及評估,然后做出正確的預測,從而實現從數據到信息、從信息到知識、從
知識到利潤的轉化,這種手段就是商業智能(BI)。
商業智能(BI)是在計算機軟硬件、網絡、通訊、決策等多種成熟技術的基礎上出現的,用于處理海量數據
的一項技術。它需要從來源多樣的數據資源(數據庫、數據倉庫、Web等)中發現規律,而這將主要依賴數據倉庫
(DW),聯機分析處理(OLAP),數據挖掘(DM)等技術來實現。商業智能不僅用來輔助商業活動作出快速反應
,發現商務運營過程中存在的問題,加快知識的獲取速度,滿足決策層對信息知識的時間性和準確性的要求。而
且通過商業智能,能夠把先進的信息技術應用到整個企業、不僅為其提供信息獲取能力,而且通過對信息的開發
,將其轉變為企業的競爭優勢。
商業智能(BI)為什么受到目前國內外企業界和軟件界如此廣泛的關注?可以用兩點來回答這種熱點出現的
原因:首先、信息技術的高速發展帶來了企業利用信息技術提高本身競爭力的巨大空間:信息技術不但使企業獲
取需要的信息,而且,促進企業對信息的再利用,以此營造企業的競爭優勢:其次、IT界許多以提供軟件平臺和
工具平臺的大公司通過多年與企業的交流,已經認識到企業對商業智能的迫切需求,紛紛加入到從事商業智能的
研究與開發上來。
目前,商業智能及其技術的理念以及它們可能為企業、事業和政府所帶來的經濟效益和管理水平的提高已經
得到部分認可。但由于BI目前尚處于從起步階段到發展階段的轉型時期,國內許多企業決策者對BI及其技術尚處
于觀望狀態,甚至許多人對BI的理解存在一定的偏差。很多人認為BI僅僅是一個進行數據分析的軟件包,一些較
為悲觀的人認為BI是存在于理想家頭腦中的、企業永遠不可能達到的境界。
應該掌握的數據分析術語
1、增長:
增長就是指連續發生的經濟事實的變動,其意義就是考查對象數量的增多或減少。
2、百分點:
百分點是指不同時期以百分數的形式表示的相對指標的變動幅度。
3、倍數與番數:
倍數:兩個數字做商,得到兩個數間的倍數。
番數:翻幾番,就是變成2的幾次方倍。
4、指數:
指數是指將被比較數視為100,比較數相當于被比較數的多少得到的數。
5、比重:
比重是指總體中某部分占總體的百分比
6、拉動。。。增長。。。:
即總體中某部分的增加值造成的總體增長的百分比。
summitzhu網友給的例子:某業務增量除以上年度的整體基數=某業務增量貢獻度乘以整體業務的增長率。例如:去年收入為23(其中增值業務3),今年收入為34(其中增值業務5),則增值業務拉動收入增長計算公式就為:(5-2)/23=(5-2)/(34-23)×(34-23)/23,解釋3/(34-23)為數據業務增量的貢獻,后面的(34-23)/23為增長率。
7、年均增長率:
即某變量平均每年的增長幅度。
8、平均數:
平均數是指在一組數據中所有數據之和再除以數據的個數。它是反映數據集中趨勢的一項指標。
公式為:總數量和÷總份數=平均數。
9、同比與環比
同比:同比發展速度主要是為了消除季節變動的影響,用以說明本期發展水平與去年同期發展水平對比而達到的相對發展速度。如,本期2月比去年2月,本期6月比去年6月等。
環比:環比發展速度是報告期水平與前一時期水平之比,表明現象逐期的發展速度。如計算一年內各月與前一個月對比,即2月比1月,3月比2月,4月比3月 ……12月比11月,說明逐月的發展程度。
10、復合增長率
復合增長率是指一項投資在特定時期內的年度增長率,計算方法為總增長率百分比的n方根,n相等于有關時期內的年數。
公式為:(現有價值/基礎價值)^(1/年數)-1
我用邁普通信技術股份有限公司CIO鄭雪:我們為什么選擇了非SaaS結構?的文章回復你:
顯性費用就如同購買軟件的費用、購買license用戶數的費用、購買定制服務的費用、購買實施服務/咨詢服務/項目管理服務的費用、購買主動運維服務/技術支持服務/應用支持服務的費用。但國內目前現狀是,這些服務類的費用往往不顯性,或打包,或打折,或收不到錢只能低質量低免費相互將就做。
這樣來看,似乎SaaS這樣明算賬的費用,確實比現有非SaaS軟件要高。
如果是非SaaS類,服務器就在我自己的機房,軟件和數據就在我的服務器上,除了網上的黑客攻擊竊取數據,剩下的只能是自己的員工。黑客沒脾氣對付,只能加強硬件防火墻和IP限制VPN限制。對自己內鬼,懲罰措施就多了。但對于軟件和數據如果在SaaS提供商手中,雖然對付黑客能力高了一些,各種災備方案多了一些,但對內鬼的懲罰卻多了一道口子。怎么舉證?怎么懲罰?
俺也來提幾個問題,請高手解答:
與許多的公司一樣,企業在發展壯大進程中,現有IT架構是否遇到以下困難: | ||||||
|
老畢這幾個問題有點意思了
1、IT架構問題 - 現在不是云計算么?如果真的規模大,用這個也不錯啊。還有就是專業的IT infrastructure 外包的服務,如果生意上幾十億的,可以考慮的。這個問題好像是老生長談了,只是很多零售企業想不明白。
2、大量數據產生,如何管理 - 一直在談客戶驅動的零售業轉型,什么供應鏈啊、營銷啊,都必須看客戶的需求,所以,充分利用好寶貴的海量的數據,是很有意思的一個話題。當然,技術上如何管理海量數據,讓系統不慢,這就看如何規劃應用架構了,什么時期的數據放什么地方,怎么利用,等等,都是需要充分考慮的,如果實在對業務有影響了,那么重新進行應用架構的調整,雖然痛苦,但是也不得不為的。