您現在的位置是:首頁 > 旅遊首頁旅遊

Python太難懂?火山引擎數智平臺這款產品可以瞭解一下

由 新眸深度 發表于 旅遊2023-01-06
簡介以電商企業場景為例,當員工需要根據現有資料構建「使用者回購模型」時,考慮整個過程需要經過資料清洗、格式轉換之後採用梯度提升樹構建,核心涉及的環節包括合併行、缺失值替換、one-hot編碼、梯度提升樹、聚合、提取欄位總共6個,因此透過Data

matlab中size是什麼意思

Python太難懂?火山引擎數智平臺這款產品可以瞭解一下

「自學Python?一般人我還是勸你算了吧!」

在國內知識分享平臺「知乎」上,這一吐槽話題獲得了超過2600次點贊,引發近600條討論。

從該話題下的高贊討論來看,多數人對Python的應用性都持肯定態度,但在門檻上卻褒貶不一,有人認為Python能夠讓新人很快入門,從而在初始階段就獲得成就感,提升興趣度;而有人則堅持長遠發展觀點,認為Python在語法上隱藏了大量概念,比如型別、多型應用原理等,如果基本功不紮實,即便是新手入了門,也難以進一步深入。

作為目前被廣泛使用的解釋型程式語言,Python憑藉多種強大的演算法和模型,和資料靈活整合分析與建模等功能,近年來風頭一時無兩。根據2021年TIOBE 程式語言社群的排名資料,Python以市場佔比12。90%排名第一位,市場佔比上升0。69%;從Python市場佔比的歷史趨勢來看,從2014年開始,Python市場佔比就開始逐年走高,至2022年,Python市場佔比達到歷史最高峰。

但另一方面,Python在使用過程中一直存在門檻問題,這導致企業內除演算法工程師之外的員工,很難深度應用。

一般情況下,企業資料的採集、治理、分析、應用往往都在安全許可權的管控下有著既定流轉鏈路,各環節對應不同崗位員工的工作要則,但不同崗位工作交接的過程中,卻偶有出現能力“斷點”。

如,資料開發一般會提供寬表來應對前線業務的需求,但在部分情況下需要將資料做行列轉換,才能對資料進行更進一步分析,而這項操作能力對普通業務崗位員工來說,是一道“攔路虎”;即便是置身這一環節“專業對口”的演算法工程師,也依舊面臨著另一個問題:目前市場上缺少可以將臨時生產好的資料與視覺化圖表聯動的產品,但這恰巧又是資料能被後鏈路環節高效應用的關鍵。

針對將資料探勘與視覺化圖表聯動,以及降低非演算法工程師崗位對資料探勘需求的理解門檻,火山引擎數智平臺VeDI旗下數智洞察DataWind,近期推出了升級功能:視覺化建模。

這項新功能封裝了超過30類常見的AI運算元能力,使用者僅需瞭解演算法的作用,就可以透過配置化的方式配置演算法運算元的輸入和訓練目標,完成模型訓練,並根據配置的其他資料內容快速得到預測結果。

Python太難懂?火山引擎數智平臺這款產品可以瞭解一下

過去,複雜演算法模型往往需要透過Python才得以實現,但現在透過DataWind同樣能夠完成搭建。

以電商企業場景為例,當員工需要根據現有資料構建「使用者回購模型」時,考慮整個過程需要經過資料清洗、格式轉換之後採用梯度提升樹構建,核心涉及的環節包括合併行、缺失值替換、one-hot編碼、梯度提升樹、聚合、提取欄位總共6個,因此透過DataWind視覺化建模構建的「使用者回購模型」流程可以參考下圖:

Python太難懂?火山引擎數智平臺這款產品可以瞭解一下

視覺化搭建的方式,一方面降低了非演算法工程師對流程的理解成本,另一方面對演算法工程師自身來說,操作也將更加簡單便捷,進一步提升工作效率。

而視覺化建模只是DataWind近期功能升級的一個縮影,在今年更早之前,DataWind就已經迎來協同層面大動作,實現與飛書、企業微信等線上協同辦公IM工具全面協同,使用者透過飛書等就可以完成DataWind資料服務一鍵訂閱,隨時隨地檢視資料、使用資料。

Python太難懂?火山引擎數智平臺這款產品可以瞭解一下

據瞭解,在歷經位元組跳動內部多業務多場景實踐之後,目前火山引擎的系列數智慧力已經透過DataWind等產品全面對外輸出,並在網際網路、汽車、零售、金融等多個行業在內的數百家標杆企業獲得應用實效。