ProductTank Taipei #5 - 當產品經理遇到資料科學家

初次參加 ProductTank Taipei 的活動，是看了 Sharon 的訊息分享，再看到場地是在 Pic Collage 舉辦，可以跟久違的 Yen-Ting 碰面，於是興匆匆報名，幸運拿到了名額！於是坐在舒適的沙發區 key 筆記。

【噓，讓資料說話】 Dcard 產品經理 - 林懷宇

由 iOS 工程師轉戰產品經理的林懷宇，在 Dcard 擔任產品經理，秉持著產品精神 "Speak your mind" 推廣、設計、行銷著自家產品，透過匿名校園社群建構著自己的使用者。近幾年來資料的儲存與運用越來越普及，而 data science 也逐漸發展為熱門領域，做資料科學，需要有 hacking skills, math & statistics knowledge 以及 substantive expertise 的 domain knowledge，而這幾年來，「產品經理」的角色，需要同時發展 Business, User experience 以及 technology 幾個領域，而 data 在這幾個方面都可以有很顯著的應用與切入，林懷宇今天想從 UX 的角度來討論。

資料的運用在產品上，一般來說分為三步驟：「記錄行為 → 分析行為（例如社群交友的抽卡使用者性別比率）→ 預測行為」。

「預測行為」會是本日最主要的重點，透過資料分析預測使用者會做哪些行為，透過預測使用者行為，找出在預測使用者行為時的關鍵資料，則更可以設計出讓使用者滿意的產品，例如推薦符合使用者喜好的內容產品，或透過高度關聯性來增加判斷準確度（未來希望可以產生專屬使用者、符合個人喜好的熱門文章列表）。

分析工具一般來說會透過 GA、Facebook Analytics 等工具進行量化分析，甚至使用 SQL 從資料庫中直接撈取行為的 raw data 進行。

以完整組織來說，記錄行為一般來說是由 Data Engineer 負責，分析行為則是由 Data Analyst 處理，進一步預測行為則是由 Data Scientist 進行，但一般公司很難有這麼完整的組織，在 Dcard，Data scientist 會貫穿三個流程，每一步驟都參與到。

林懷宇說，想要特別討論「當產品經理遇上資料科學家時」會產生什麼樣的火花？事實上，產品經理不只是需要理解「公司以外的人（使用者）」，更重要的事理解「公司裡的人」，產品經理需要協調公司內的人，把產品順利打造出來，需要思考的是「為什麼團隊需要產品經理？」「對產品經理而言，最重要的事情是什麼？」「資料科學家需要什麼？為什麼需要你？」

產品經理很重要的任務就是「讓產品上市」，因為當產品沒有真正面對消費者，永遠都不會知道消費者真正要的是什麼。

以林懷宇跟資料科學家互動的經驗來說，資料科學家一般都是很重視邏輯的，因此需要很清楚的需求描述，不能有模糊地帶，溝通需要很有邏輯。同時產品經理也可以協助處理簡單的資料整理，讓資料科學家可以專注在最重要的任務上。

林懷宇問在場與會者：「若你是資料科學家，會希望產品經理怎麼跟你溝通？」事實上，與過去我們討論 UE 的設計傳達相同，就是「盡量掌握對方的用語、詞彙」，用對方懂的語言來溝通，因此產品經理需要盡量讓自己學習資料科學相關的基本知識，降低溝通門檻。

對產品經理來講，打造出一個資料型產品，最重要的就是定義出「核心需求」，資料型產品的開發流程可以分為八個步驟，前三項會是產品經理最主要的責任：

1. 定義核心目標

以 Dcard 為例，是「讓使用者更容易找到感興趣的文章」

2. 將目標轉為可觀測的指標（如何將目標轉換成指標？如何判斷結果是好是壞？如何衡量及取捨？）

轉化目標為指標會是最困難的部分，林懷宇舉 Dcard 的指標為例：每人每日使用論壇的時間、每人每次在首頁中的文章點擊次數、每人每日進入首頁幾次、前 1, 5, 15, 50 篇首頁文章的點擊率。

3. 定義欲收集的資料（應收集哪些資料？其他服務做過類似收集了哪些資料？哪些資料有助於分析以及模型改善？）

可以參考已經在做推薦系統的服務如何做，例如 Netflix, YouTube，這些服務商會把部分演算法以 open source 的方式公開在網路上，這些都可以當參考。簡單的例子，使用者資料，如年齡、性別、學校、系所等，甚至是在文章上停留的行為，包含閱讀、留言、收藏、喜歡等，另外包含文章的作者與內容、訂閱看板、常看的看板類型，都是可分類的標籤。

4. 定義收集資料的策略

使用者資料在註冊 Dcard 帳號時就已經收集了，是既有資料，在文章上的操作行為也是網頁開發時就開始搜集的資料，這些對 Dcard 都不是問題。

5. 分析資料
6 透過資料建立模型

合併來說，會是如何找出資料和行為之間的關聯性？如何預測使用者未來的行為？如何建立出預測行為的模型？而建立模型則牽涉到人工智慧的技術，如決策樹、機器學習等，但如果沒有資源可以建立這種技術平台時，也可以使用「工人智慧」來處理這些資料。

7. 檢驗模型是否有效（主要是資料科學家的部分，但需要協助資料科學家做 A/B testing，讓產品上線）

如何在推出前就先行測試 train 出的 model？如何確認是否有效？如何小量測試？驗證過後如何改良更新？

Dcard 以 model 產生的推薦內容來比對最新使用資料做驗證，若有信心，則可以做內部測試，再進一步就是推上線做 A/B testing。

8. 透過結果，決定下一步

以上八個步驟，林懷宇以自己的經驗來說，#2, #3 會建議資料科學家一起參與，可以協助產品經理更準確的定義需求。

總結自己的經眼，林懷宇提醒大家「完成比完美更重要」，讓產品上線永遠會是產品經理最重要的任務，同時「有些時候工人智慧不輸給人工智慧」，考量產品 Go to market 的時間，不要拘泥於技術，工人智慧也會小兵立大功。

林懷宇給希望切入資料型產品的 Product Manager 一些自我修煉建議：

1. 使用各種分析軟體：GA、Facebook Analytics
2. 學習解讀資料、拆解資料，挖掘資料背後揭露的事實
3. 試著學習 SQL，可以直接從資料庫挖掘資料
4. 學習機抽象的概念轉換成實體的數據
5. 挑一門 MOOC 課程資料科學

【產品經理和資料科學家合作學到的 10 件事】 KKBOX 產品經理 - Anadem Chung

KKBOX 內部在 Data science 上，分為兩種角色，Machine learning researcher 以及 Data scientist，今天 Anadem 主要分享 ML 的部分。

在 KKBOX 內部演算法處理的幾個資料面向包含 ranking, classification, clustering , recommendation, prediction。如推薦歌單、排行榜歌單、編輯歌單等的排序，會透過 ML 處理，讓使用者最快發現有興趣的歌單並開始播歌，另外也會透過同溫層（喜好歌曲）來擴展使用者的聽歌範圍，透過推薦歌曲/歌單、推薦藝人等功能，協助使用者認識更多歌曲，也擴增歌曲的點播率。另外也有 content-based 的曲風電台，使用者在聽電台時，也會透過 content-based 的算法來產生電台內容。

Cold start 的問題會是 ML 的挑戰，意即碰到「全新、沒有聆聽紀錄」的使用者時，要怎麼推薦？這時候會透過喜好的問答，以決策樹來產生推薦結果。

Anadem 以圖解機器學習網頁為例，機器學習一開始會以「直覺」做出發點，再「加一點常識」，進一步「劃分邊界線」、「尋找分界點」等，在 KKBOX 中會參照這些步驟去優化決策樹，訓練模型分類的準確度，同時透過與產品經理的交流確認特徵

Takeaway

演算法的推薦功能，如何開需求？

如果僅只按照規則（rule-based）來產生結果，就會很死板。KKBOX 的產品經理會透過這七個問題跟資料科學家提需求：

要解決的問題是什麼？（value proposition）
誰是目標對象？（TA）
衡量的標準是什麼？（evaluation metrics / success metrics）例如本週使用者的歌單是否有所擴展？
基於什麼觀察，我們為什麼可做得好？使用者為什麼會買單？（our differentiation）
為什麼是現在？（why now?）
什麼是成功的關鍵因素？（solution requirements）
未來持續成長/優化的策略是什麼？（growth strategy）

ML 的產品上線標準和一般產品不太一樣，需要透過「反覆不斷調校，直到信心水準達標才上線」，過程中會發現很多「邏輯以外的 insight」，再加入 model 訓練，才會進到 production 的 A/B testing 程序。

Eyeball test 的結果很重要，透過編輯的內部測試，會發現一些重要的問題，例如，在古典或沒人聲的推薦歌單中，突然出現一條 rap，但可能使用者本來就有在聽 rap，因此 model 會產生這種結果，但透過編輯的 feedback，產品經理可以轉譯為：「要如何在演奏曲風中排序穿插出現人聲曲風？」據此跟資料科學家溝通，產品經理需要優化 eyeball test 的流程與 feedback 的內容，以加速迭代的速度。

或是使用者並不認為自己是「老歌愛好者」，但使用者的 profile 明明就喜歡老歌，但他的喜好設定卻不是這樣，這時候該怎麼推薦？另外也會遇到「藝人喜好」問題，當使用者切掉這個藝人的歌時，背後是因為「不喜歡這個藝人」還是「這首歌聽過了」？

資料型產品一定要先有資料，而資料的背後其實有很多細緻的討論，包括對現象以及對使用者的理解，如「隨機播放並不隨機」的演算法問題，背後解讀可能是「播放次數少的歌曲，需要在隨機播放時被提升播放機率」。

沒有資料的時候怎麼辦呢？自己打造！

Golden set → Model training → Eyeball check → Model iteration (feedback to eyeball check) → Release

質性的現象需要透過精準的描述，來和資料科學家溝通，最好可以佐以資料與數字的描述。Anadem 建議，產品經理最好可以「喜歡處理資料問題」，比較能樂在其中。例如思考 ranking 的微調，會是非常細微的變動幅度，因此如果不喜歡資料可能沒辦法得到明顯的成就感，同時喜歡資料的話，比較可以體會到資料科學家的貢獻，也能感覺到其中的變化。

Product Strategy 仍然需要呼應 Business strategy，而這是所有產品經理都應該謹記在心的。當然還有一些撇步，例如先做 ROI 高的功能，才能幫產品打好底。同時透過四個面向跟資料科學家討論：成本 cost /開發資源 resources、風險 risk、預期價值 success metrics、使用者有感度（coverage），需要透過這些問法旁敲側擊，才能更精準的評估出資源投入的方向。

Anadem 也提醒，遇到瓶頸的時候，可以「轉彎」，例如透過 UI 設計吸引使用者等，不一定要透過演算法解決所有問題，有很多種問題的解法。

產品上，記得要讓每個推薦功能「定位清楚、具差異性」，每個推薦功能，在不同面向也會有不同重心，KKBOX 分了八個方向：

Personal preference 個人偏好，例如曲風、語言、藝人、樂器...
Relevance 相關度，例如在向量空間上的位置越接近
Popularity 熱門程度，例如播放次數高的，被收藏次數高的
Cold start 使用者的歷史資料少的時候，如何很快推薦可能感興趣的內容
Serendipity / Novelty 新穎度，幫使用者跨出舒適圈的幅度
Diversity 多樣性，要涵蓋的藝人獲曲風的廣度
Trending 近期竄紅的內容
Context 呼應情境或是互動式的介面，來回應使用者當下的意圖

而討論到產品經理在以 back-end 演算法為主的產品上，到底要如何貢獻價值呢？Anadem 認為有幾點：問好的問題（刺激資料科學家的解法）、想到很棒的應用（發揮演算法的價值和影響力）、詮釋現象的能力（把現象或數據提高到洞見或抽象化的俯角 high-level 問題面向，透過適當的語彙，加以歸類，避免單點描述）、緊盯 success metrics（使用者隨時會離開）、策略思考（推出有發產性的產品符合使用者需求以及商業目標）。

Anadem 比喻產品經理和資料科學家的合作，是「像個爵士樂團」般：「有 pattern，但也允許隨興發揮，有主旋律但不受限、接受不確定性也擁抱不確定性、讓每個人都有 solo 的機會。」才能結合團隊智慧產生出有價值且可以上線的資料產品。

ProductTank Taipei #12 - 大型組織的產品管理與協作

- October 02, 2018

難得提早到現場，開了電腦正在準備，突然發現 Peter 正在遠端連線，抓圖時才發現，原來人在荷蘭的 Peter 今天是遠端分享，算是很特別的經驗。 Celine 「裸辭」上一份工作後，輾轉到了中國的攜程工作。直接破題的 Celine 以攜程旅遊網的首頁為例，告知頁面信息的排序，事實上並不只是考慮使用者的閱讀習慣與興趣，而是依據組織內部的角力，哪個組織收付的佣金夠多，排序就會提前，例如：酒店、機票、旅遊等區塊，就會有所上下排序調整。 Celine 的工作是後端的靜態信息組。攜程分為垂直式、水平式分工，垂直式分工意指從後端信息整合、API 接口到前台的 App UI 呈現和實作，水平式分工則指當重要功能需要整合時，便需要拉出平行橫跨並進的規劃作法。在大公司工作讓 Celine 覺得任務非常複雜，例如做「需求調研」時，若功能橫跨各信息組或功能組，則一個需求便是牽一髮動全身，需要橫跨各組做繁複的溝通，甚至要召開【需求澄清會】，遭受各組的炮轟，最後再回去重寫。若想要做一個扁平的東西，仍然需要跟開發努力爭取資源，並跟各部門 PK 優先，甚至談好資源之後，若開發部門有緊急事件，仍會不告知值接插隊延後需求實作，而為了功能，測試資源也是稀缺資源要透過血淋淋的爭取。很多事情即使講很多次，還是會有人聽不懂！ Celine 分享開發產品時的四個主要步驟：需求調研需求評審開發測試優化迭代理想的狀況是這樣的：需求調研 - 開發、內部/外部訪談、PRD 撰寫需求評審 - 內部評審、外部評審開發測試 - 敏捷開發、測試優化迭代 - 投訴處理、收集需求現實中是這樣：需求調研 - 查出接口的所有調用方、調研開發可行性、召開 N 遍需求澄清會、梳理業務流程需求評審 - 到 N 個部門講 N 遍需求、跟各部門 PK 優先級、預先爭取測試資源開發測試 - 講 N 遍需求、確認開發負責人、開發功能微調、跨部門溝通優化迭代 - 跨部門講 N 遍需求、修 bug、運營流程優化、用戶反饋整理 Celine 接著分享攜程內部常用的操作方式：盡量找到大部分的調用方（stakeholder）項目管理工具（JIRA-cp4 + Teambetion, Lengoo, etc.）但其實

Search This Blog

Ying @ Taiwan

ProductTank Taipei #5 - 當產品經理遇到資料科學家

Comments

Post a Comment

Popular posts from this blog

【2023 應用心理學與實務研討會】AI 都不 AI 了 - 由 AI 生成到 AI 思維－生成藝術的創意空間（李怡志）

ProductTank Taipei #12 - 大型組織的產品管理與協作

【2023 應用心理學與實務研討會】AI 都不 AI 了 - 由 AI 生成到 AI 思維－ChatGPT 的解析與挑戰（陳縕儂）