close

CDA數據分析師 出品

來源:datacamp

編譯:Mika

根據《韋氏詞典》,數據指的是用作推理、討論或計算基礎的事實信息。

基於這個定義,我們可以進一步得出:數據可以理解為是收集到的任何信息,可以使用、進一步處理和分析以獲得見解。而且通常與計算機聯繫在一起,因為數據通常是在計算機中生成和存儲的,然而數據存在的時間比我們想象的要長得多。


數據的歷史

人類存儲和分析數據的最早例子可以追溯到公元前18000年,當時人們發現史前人類使用計數棒進行初步計算。這些舊石器時代部落的人在木棍和骨頭上刻上刻痕,以記錄人類的活動,比如交易和監控物資。到公元前2400年,在巴比倫發明出了用於計算的算盤。

縱觀歷史,數據收集、處理和分析的不斷發展是通過石板、粘土、紙莎草、木頭和紙卷上的大量文字來體現的。最終,隨着更多形式的數據被發現,處理、收集、存儲和分析數據的需求也在不斷發展。

隨着人類社會的進步,對數據處理的要求也越來越高。

19世紀,在美國開始人口普查進行。人口普查中的數據點數量呈指數增長,美國人口普查局估計,收集和分析人口普查中的所有數據需要幾年甚至幾十年的時間。

這是個很大的問題,因為只有在下一次人口普查即將開始時,才會完成對當前人口普查數據的匯編和分析。

幸運的是,一位名叫赫爾曼·霍勒里斯的年輕工程師和發明家開發了霍勒里斯制表機。這是一種機電式制表機,將收集和分析人口普查數據所需的時間從幾年縮短到僅僅幾個月。正因為如此,霍勒里思被視為現代自動計算之父,後來因創立IBM而聞名。

快進到20世紀,計算機出現了。隨着功能更強大的計算機的出現,對數據存儲的要求也越來越高。

德國-奧地利工程師弗里茨·普夫勒默發明了一種在磁帶上磁性存儲信息的方法。他的一些發明原理至今仍被用於數字數據存儲。

在這個時代,「商業智能」一詞越來越流行,因為對新興軟件以及用於分析商業和運營績效的系統的需求迅速增加。

1989年,蒂姆·伯納斯·李創建了萬維網(又稱互聯網),數據革命發生了真正的變化。這導致了全世界人民之間的自動信息共享。這意味着今天有更多的數據被共享、創建和存儲,從而產生了收集、使用和分析數據的新方法。


向「大數據」過渡

由於20世紀90年代互聯網的驚人增長以及個人電腦和計算設備的穩定發展,在線設備的數量以及由此產生的數據量迅速增長。

雖然大數據的概念早在20世紀90年代就已經存在,但直到2005年羅傑·穆加拉斯才正式給它貼上標籤。他將其描述為"使用傳統商業智能工具幾乎無法管理和處理的大量數據"。

大數據是一個用來描述大量數據的術語,包括結構化數據和非結構化數據,這些數據每天都會淹沒企業。它包括信息量、創建和收集信息的速度,以及所覆蓋數據點的種類或範圍。

考慮到大數據的規模和複雜性,收集、組織和分析它以發現模式和其他有用信息的過程已經成為幫助許多組織做出商業決策的一部分。這反過來又催生了數據科學——一個跨學科領域,它使用科學方法、流程、算法和系統從大量數據中發現模式,並使商業領袖能夠獲得見解。


什麼是數據科學?

根據IBM的說法,數據科學是一種多學科方法,可以從當今組織收集和創建的大量且不斷增加的數據中提取可操作的見解。

該領域通常需要計算機科學和純科學技能,因為數據科學家在其方法中應用科學方法,並使用預測分析和人工智能從數據中提取見解。

如今,「數據科學」經常被企業和組織用作處理大量數據的通用術語,無論是準備、清理、分析數據還是可視化數據以揭示模式。

以下我們列出了可從事的七種數據相關職業:

01

數據科學家


數據科學家需要能夠應用數學、統計學和科學方法。

使用多種工具和技術來清理和準備數據;進行預測分析和人工智能;並解釋如何利用這些結果來為商業問題提供數據驅動的解決方案。數據科學家需要的技能比數據分析師多得多。

02

數據分析師


數據分析師收集、處理和執行統計數據分析,為組織得出有意義的結論。

數據分析師將大型數據集轉化並處理成可用的形式,如報告或演示。他們還通過研究重要的模式來幫助決策過程,並從數據中收集洞察力,然後有效地傳達給組織領導,以幫助商業決策。

03

數據工程師


數據工程師負責準備、處理和管理收集和存儲的數據,用於分析或操作用途。

像傳統的工程師一樣,數據工程師建立和維護數據 "管道",將數據從一個系統連接到另一個系統,使數據科學家能夠獲得信息。正因為如此,數據工程師被要求了解數據科學中使用的幾種編程語言,如Python、R和SQL。

04

數據架構師


數據架構師主要是設計和創建數據管理系統的藍圖,然後由數據工程師建立。

類似於傳統的建築師,數據架構師是 "遠見者",因為他們負責可視化和設計一個組織的數據管理框架。此外,數據架構師改善現有系統的性能,確保數據庫管理員和分析師能夠使用這些系統。

05

商業智能(BI)開發人員


商業智能開發者是專門的工程師,他們使用軟件工具將數據轉化為有用的見解,以幫助商業決策。

他們負責簡化技術信息,讓公司里的其他人都能輕鬆理解。簡而言之,他們創建和運行包含他們使用商業智能工具找到的數據的報告,並將信息轉化為更通俗的術語。

06

統計員


鑑於統計學是數據科學的主要基礎之一,許多統計學家可以輕鬆地過渡到數據科學領域。

統計學家主要負責數據的收集和處理。他們決定需要什麼數據以及如何收集數據。此外,他們設計實驗,分析和解釋數據,並報告結論。

07

機器學習工程師


機器學習工程師是另一組專業工程師,他們專注於研究、構建和設計人工智能和機器學習系統,以實現預測模型的自動化。

基本上,他們開發的算法使用輸入數據並利用統計模型預測輸出,同時在新數據可用時不斷更新輸出。

下面我們看看以上這些數據科學職業的最受歡迎程度。下圖顯示了2021年12月8日美國的職位空缺情況。

數據架構師是最受歡迎的數據科學職業道路,因為他們在創建其他數據科學專業人員隨後使用的數據管理系統方面非常重要。

接下來是機器學習工程師,考慮到利用人工智能預測許多科技公司結果的重要性。

需求最少的是統計人員,主要是因為許多傳統的統計學家現在正在成為數據科學家。統計學家從純統計學轉向數據科學相對簡單是,他們已經擁有成為一名成熟的數據科學家所需的基礎知識。


數據科學的發展速度並不慢

毫無疑問,數據科學如今非常流行,但更好的問題是,它在未來還會如此流行嗎?根據就業預測,情況似乎的確如此。

美國勞工統計局2020-2030就業預測的數據顯示,數據科學職業,包括統計學、數據科學以及數據工程等其他基於數學和科學的職業,從2020年到2030年的百分比變化來看,將呈現出非常高的增長率。統計學家總體排名第14位,而數據科學家和其他數學科學職業在數據中包含的790個職位中總體排名第31位。

儘管統計學家和數據科學家在總勞動力中所占的份額與其他職業相比很小,但隨着數據科學職業道路變得越來越流行,這些數字預計將在未來幾年增加。

下圖顯示了統計學家、數據科學家和其他數學科學職業與其他預計增長率較高的職業的對比情況。


當之無愧的高收入職業

數據相關職業備受歡迎的一個主要原因在於其收入高。

下圖顯示了紐約市10種不同職業--包括數據科學家和數據分析師的工資範圍。這些數據來自Teleport,該網站匯總了不同城市的生活條件,如工資的數據。

根據Teleport的數據,數據科學家的年薪中位數在紐約市排名第四,為114105美元,僅次於企業高管和醫護人員。事實上,在馬尼拉等其他一些城市,數據科學家的排名高達第二,僅次於企業高管。

數據分析師的薪資也很可觀,數據分析師的年薪中位數為61818美元,仍然相當於紐約市的平均家庭收入。


就業市場不斷增長

數據科學受歡迎的另一個主要原因是,如今的企業將數據科學的原理整合到日常運作中。下圖顯示了工作中涉及數據科學的前10個行業,其中涉及到8000家公司的樣本數據。

毫不奇怪,包括谷歌、蘋果和優步等科技公司占據了榜首。畢竟,大數據的激增是由互聯網的誕生引起的,互聯網與軟件和技術密切相關。數據科學實際上是使用各種工具和技術處理大量信息。

接下來是金融服務公司,這是金融科技公司崛起帶來的。作為「金融」和「技術」的門戶,金融科技公司將技術和創新整合到其服務和產品中,以改善其對客戶的交付,擾亂傳統金融服務。由於它涉及處理大量數據,如客戶信息,金融服務公司看到了數據科學工具的潛力,可以幫助簡化和優化流程,改進服務。


結語

數據科學是一條非常有發展的職業道路,而且沒有放緩的跡象。在未來的許多年裡,它將繼續塑造和影響企業和組織的運作方式。

至於你應該走哪條特定的數據科學職業道路,這主要取決於你的個人優勢和總體興趣。重要的是,上述任何職業都是值得的。

參考鏈接:

https://www.datacamp.com/blog/an-analysis-of-the-top-7-trending-data-science-careers-to-pursue


如果你也想快速成為一名數據分析師,

這裡順便給大家總結了

一份數據分析學習資料,

歡迎掃碼領取學習。

👇👇👇


點這裡👇關注我,記得標星哦~


推薦閱讀

CDA課程諮詢

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()