如今,數據科學與人工智能正越來越普遍——尤其是隨着 Netflix、亞馬遜、Facebook、Spotify 等大公司不斷部署人工智能戰略,想在幕後與消費者展開更緊密的互動。
但是,有很多企業並沒有用好數據科學,而把數據科學當成了一個好看而無用的花瓶。到底應該如何「正確地應用」數據科學和人工智能呢?如何真正地從業務需求出發,把數據科學用在刀刃上呢?今天這篇文章,我們就來看看Netflix是如何從產品需求出發,讓數據科學和機器學習成為真正的增長引擎,而不是擺設的花瓶。
電影推薦個性化——觀看A電影的用戶可能會觀看 B電影。這可能是 Netflix 最著名的功能, Netflix根據品味相似的用戶觀看歷史記錄來推薦你接下來可能最有興趣觀看的內容,從而提升客戶滿意度,維持訂閱量。
縮略圖的自動生成和個性化——Netflix使用來自現有電影或節目的數千個視頻幀作為縮略圖生成的起點,再對這些圖像進行注釋,然後對每張圖像進行排名,從而判斷哪些縮略圖最有可能被客戶點擊。這些計算基於與你相似的用戶點擊的內容,發現可能喜歡某些演員/電影的用戶更有可能點擊具有某些演員/圖像屬性的縮略圖。
電影製作的選址(前期製作)——Netflix使用數據來輔助決定最佳拍攝地點和時間。考慮到日程安排(包括演員/工作人員的可用性等)、預算(場地、航班/酒店成本)和製作的限制場景要求(比如是白天還是夜間拍攝,極端天氣狀況的發生概率等)。這個應用場景屬於數據科學中的優化問題,而不是基於過去數據進行預測的機器學習模型。
電影編輯(後期製作)——Netflix使用過去的有質量問題的視頻數據(指字幕與聲音/動作不同步的情況)——預測人工檢查在什麼時候最有益,因為人工檢查往往是一個非常耗時和費力的過程。
流媒體質量——使用過去的觀看數據來預測帶寬使用情況,以幫助 Netflix 決定何時緩存區域服務器,從而能在在峰值(預期)需求期間加快加載時間。
對Netflix而言,這 5 個數據科學/機器學習的應用產生了非常可觀的影響,而它們之所以能對Netflix的業務產生長足的影響是因為,Netflix的數據科學家和產品經理們,能夠把這些數據科學技術與業務需求正確地聯繫起來。如果沒有把這些技術與業務進行連接,那麼這些技術就只會是空中樓閣。只有把這些技術和 Netflix 的核心業務問題聯繫起來,才能真正改變人們的生活。
那什麼是所謂的「業務需求」呢?

在有限的觀看時間內增加/保持收視率
增加探索的視頻的數量,重新登錄的頻率
超過公司制定的任何最低閾值
每月訂閱忠誠度總體增加/訂閱者取消減少

2. 個性化圖像縮略圖:識別問題

Netflix使用哪些數據來創建這些個性化縮略圖?
Netflix使用哪些數據將這些自定義創建的縮略圖定位到個人?
一集《怪奇物語》有1小時,其中包括超過 86,000 個靜態視頻幀。
這些視頻幀可以單獨被分配某些屬性,這些屬性稍後會經由一組稱為美學視覺分析 (AVA) 的工具和算法過濾,成為最佳縮略圖的候選者。這一系列操作是為了了從視頻的每個靜態幀中找到最佳的自定義縮略圖圖像。
Netflix 注釋 — Netflix 為每一幀創建元數據,包括亮度 (.67)、面部數量 (3)、膚色 (.2)、裸露概率 (.03)、運動模糊級別 (4)、對稱性 (. 4)。
Netflix 圖像排名 — Netflix 使用來自上方的元數據來挑選出最高質量的特定圖像(光線良好、無運動模糊、可能包含一些從適當角度拍攝的主要角色的面部照片、不包含未經授權的品牌內容等) ) 和最容易被點擊的圖像。

觀看的電影數量,每個節目的觀看分鐘數
每個視頻/系列的完成百分比
『點讚』的數量,哪些電影獲得了最多的贊
可歸因於任何特定節目的整體觀看內容的百分比(用戶是不是出於對特定演員/節目的興趣才觀看的)
與用戶參與度等相關的任何季節性或周趨勢。
Netflix利用這些數據來匯總每個用戶的全景圖,構建每個用戶的個人資料,並根據數百甚至數千個不同的屬性對每個用戶進行數學索引。他們這樣做是為了將興趣相似的人組合在一起,這樣就可以利用來自一個用戶的數據來幫助預測其他類似用戶的可能行為。



由此,Netflix在以「正確的方式」應用人工智能、數據科學和機器學習方面做得非常出色 —— 使用基於產品的方法,首先關注業務需求,然後才利用人工智能解決方案,而不是反過來。
1你將獲得
真槍實彈的A/B測試項目實操,百萬量級真實數據+五大應用案例,從零學會A/B測試的里里外外!
為你建立一個完整的、專業的、深度還原大公司的的A/B測試項目,讓你在面試時可以自信展示自己親自做的案例,成功拿下offer!
從0到100真實操作A/B測試項目的全套流程:數據清洗、數據自動化處理、實驗設計、實驗執行、結果分析、報告展示。
經歷真實工作場景中的、各大互聯網科技公司里使用的A/B測試流程,以及適應不同商業場景的各類實驗/准實驗方法。學會工作中最重要的分析方法!
深度學習A/B測試實戰中常見的測試陷阱及避免方法。
牢固掌握公司里A/B測試項目中的實際SQL與Python應用,為A/B測試搭建數據庫、清理數據、創建數據集。
學會用Python自動化實現A/B測試,為你的老闆提高100%的工作效率!
接受系統的統計訓練,打下堅實牢固的統計基礎,徹底明白A/B測試的統計原理、分析方法、實驗設計方法、抽樣準則。
各大互聯網、科技公司A/B testing面試題解題步驟示範與詳細解析。對互聯網科技公司的深度剖析和指標介紹,讓你自如面對各類面試考驗!
模擬實際工作中與產品經理的合作,培養商業意識與產品思維。
專業的Bootcamp經歷簡歷模版與認證證書,可以曬到LinkedIn等求職網站,大大提高面試邀請率!
福利升級:訓練營以往只內推成功從訓練營中畢業的學生。但在疫情期間,所有A/B測試實戰訓練營學員,均可獲得全職或實習崗位的內推機會!
2訓練營老師介紹
美國知名電商Wayfair高級商業分析專家
擁有多年電商A/B測試實戰經驗,及新人教授經驗
精通AdvancedSQL, Python等數據分析工具
設計推出的A/B測試,為公司帶來上千萬美元的收入

Emma老師對學員知無不言,有問必答!無論是面試中遇到的問題,還是工作中遇到的困惑。

3訓練營課程內容
整個Bootcamp歷時8周,每周3小時課程,共計24小時課時。
周末線上實時授課,課後完成老師布置的作業,助教團隊在班級群內隨時答疑,直播錄像永久回放。
五大課程模塊:
A/B測試商業訓練(案例、變量設計、測試計劃)
A/B測試數據技能訓練(數據源概況、SQL數據庫建立、Python自動化分析)
A/B測試實驗設計訓練(A/B測試 vs 准實驗、實驗步驟、真實商業環境中的實驗挑戰)
A/B測試統計訓練(統計分析、深度解析)
A/B測試面試訓練
課程內容涵蓋了A/B測試在各大互聯網科技公司中的完整工作流程:
A/B測試統計基礎與應用場景
A/B測試實驗設計
A/B測試假設檢驗、變量選擇、流量計算與實驗周期計算
A/B測試各類應用場景中的實驗變體與前後測實戰分析
用SQL與Python完成A/B測試項目實戰
A/B測試結果解讀與高階統計
結果展示
每位學員將有一套親自做的A/B測試成果作品
每位學員獲得A/B測試面試真題解題輔導
結課後,每位學員獲得提升簡歷的Industry Project Experience完美描述,所有學員獲得內推機會!
了解A/B測試在頂流科技公司中的各類應用場景
了解A/B測試適用的商業問題與它的局限
了解科技公司產品團隊如何使用A/B測試
面對商業問題,如何設計有效的假設?
如何制定A/B測試的實驗計劃與執行框架?
搭建一個真實的A/B測試實驗數據庫
了解A/B測試中常面臨的數據問題
用SQL對數據進行清洗與轉制,完成樣本選取、組別分配、變量選取等實驗步驟,為A/B測試做好數據準備
用Python搭建A/B測試分析流程
充分了解A/B測試的實驗步驟
設立零假設與被擇假設
確認實驗指標,設計實驗變量
根據指標類型確認統計檢驗方法
估算樣本量,確定實驗周期
置信區間與統計功效
A/B測試中的各類偏差
樣本量不夠或其他實驗條件不滿足時的實驗設計
了解准實驗與A/B測試的應用區別
為項目案例設計A/B測試實驗
抽樣技術
樣本量與統計分布
統計測試的不同類型和指標(T測試, Z測試, Z分數, P值)
統計顯著性
統計功效
置信區間
假設檢驗的兩類錯誤等
4訓練營學員作品






5報名方式

第1名~第5名:1299美元(優惠$700)
第6名~第10名:1499美元(優惠$500)
第11名~第15名:1599美元(優惠$400)
第16名~第18名:1799美元(優惠$200)
第19名~第20名:1999美元(原價)
