最近中文字幕免费mv在线视频,野狼第一精品社区,中文在线中文a,最近2019免费中文第一页,永久免费观看美女裸体的网站

更新于 8月28日

AI數(shù)據(jù)高級工程師

1-1.5萬·13薪
  • 成都錦江區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招2人

職位描述

爬蟲Python反爬蟲分布式爬蟲數(shù)據(jù)清洗數(shù)據(jù)采集數(shù)據(jù)挖掘爬蟲開發(fā)
崗位職責:
1. 設計并實施多模態(tài)(文本/圖像/音頻/視頻)數(shù)據(jù)采集方案,覆蓋公開數(shù)據(jù)集、網(wǎng)絡爬取、合作方數(shù)據(jù)及定制化采集場景
2. 開發(fā)自動化數(shù)據(jù)處理流水線,包括清洗、標注、增強、質(zhì)量驗證等環(huán)節(jié),支持計算機視覺/NLP/語音等AI模型訓練需求
3. 構建數(shù)據(jù)質(zhì)量評估體系,設計異常檢測與自動修正機制,確保數(shù)據(jù)合規(guī)性
4. 優(yōu)化數(shù)據(jù)存儲與檢索架構,處理PB級非結構化數(shù)據(jù),平衡成本與訪問效率
5. 與算法團隊協(xié)作,根據(jù)模型表現(xiàn)反推數(shù)據(jù)缺陷,迭代改進數(shù)據(jù)策略

核心要求:
計算機相關本科以上學歷,3年以上數(shù)據(jù)工程經(jīng)驗
技術棧必備:
數(shù)據(jù)處理:Python(Pandas/Numpy)、SQL、Spark,熟悉正則表達式與ETL設計模式
數(shù)據(jù)采集:Scrapy/Selenium/API集成,反爬應對經(jīng)驗
標注工具:Prodigy/CVAT/Label Studio二次開發(fā)能力
云平臺:AWS S3/EC2或同類服務的數(shù)據(jù)管道搭建

加分項:
熟悉Active Learning/弱監(jiān)督數(shù)據(jù)標注方法
有傳感器數(shù)據(jù)(LiDAR/雷達等)處理經(jīng)驗
了解數(shù)據(jù)眾包平臺質(zhì)量管理機制
計算機視覺/NLP領域數(shù)據(jù)處理專長

軟性要求:
能快速理解業(yè)務場景的數(shù)據(jù)需求,提出成本/質(zhì)量/時效平衡的解決方案
對數(shù)據(jù)偏見和標注歧義有敏銳洞察力
具備技術文檔撰寫能力,可制定數(shù)據(jù)標準操作流程(SOP)

優(yōu)先考慮:
有自動駕駛/醫(yī)療影像/多語言NLP等垂直領域數(shù)據(jù)處理經(jīng)驗
主導過從0到1的大規(guī)模數(shù)據(jù)基礎設施建設項目
發(fā)表過數(shù)據(jù)質(zhì)量相關論文或開源工具貢獻者

我們提供:
參與國際級AI項目的數(shù)據(jù)體系建設
技術決策權與彈性工作制度
數(shù)據(jù)工程專項培訓預算

工作地點

成都錦江區(qū)時代8號(東大街芷泉段)602-605

職位發(fā)布者

蒲女士/HR

立即溝通