大數據性能測試（比較水，僅供一點點參考）

2022年10月08日20:05:49 科技 1087

✦ +

大數據性能測試的目的

1.大數據組件的性能回歸，在版本升級的時候，進行新舊版本的性能比對。

2.在新版本/新的生產環境發佈之後獲取性能基線，建立可度量的參考標準，為其他測試場景或者調優過程提供對比參考。

3.在眾多的發行版本中進行測試比對，為PoC測試提供參考數據。

4.支持POC測試，得出結論，到時候可以根據業務模型和需求，或者根據客戶需求選擇不同的方案。

5.在客戶方進行性能測試，達到客戶要求的性能標準滿足客戶使用的需求。

✦ +

性能測試的時機

上線新版本
上線新的環境/新的主機
開闢了新的區域
PoC 測試
性能專項測試

✦ +

性能測試的步驟

明確測試的目標

確定性能測試場景，集群規模和規格，數據量，數據格式，壓縮算法等。

比如：

版本迭代測試，需要和歷史版本集群規格和參數對齊，以便比較版本性能是否劣化；
Poc測試需要明確客戶場景；
軟件發行商測試，需要與發行商集群規模保持一致。

申請主機環境和測試周期

搭建運行環境和監控

獲取的性能指標，部分包含：性能數據，比如帶寬、磁盤IO、CPU、內存等指標。

開展測試

測試過程中使用nmon或者其他系統監控的工具記錄系統指標變化，以供發現系統瓶頸，利於後續調優。

針對性能結果進行調整優化

進行迭代性能測試。

出具性能測試報告

✦ +

大數據組件測試工具和方法

除了上述主流的大數據主鍵外還有Hbase等，除了主流的測試工具Hibench之外還有雅虎的大數據測試套件。

✦ +

大數據性能調優

在大數據領域普遍存在數據傾斜的問題，需要參考對應組件的官方文檔以及參考業界的案例介紹。

✦ +

大數據相關的測試

基準測試

單一用戶單個事務的測試，目的是在對選擇的用戶在無壓力的情況下獲取系統處理單個請求的情況。

負載測試

通過逐步增加系統的負載，測試系統性能的變化。

穩定性測試

通過給系統加載一定的業務壓力，運行7*24 小時，以此檢測系統是否穩定運行。

功能測試

特別是在OLAP引擎選擇的時候，需要測試其對標準SQL支持的情況，如部門不支持update和delete操作、不支持with語句、不支持except和intersection操作等。

性能需求

CPU、內存、磁盤IO、網絡負載使用率不超過80%，響應時間90%的讀取、寫入、導出、導入不超過3s，有不到10%的響應時間不超過5s。

測試案例

1.在不同數據量（100G、500G 、1T）分別對Hadoop和spark進行讀取、數據寫入、數據導出數據導入基準測試。

2.在不同數據量下進行並行和讀寫混合測試。

3.在不同數據量下進行7*24小時的數據穩定性測試。

測試觀察指標

CPU 使用率
內存使用率
IO
網絡
響應時間
其他指標

科技

870買驍龍870！最強平民旗艦手機，人人都買得起！

說到人人都買得起這個梗，可能大家第一時間就會想起發佈已經有一段時間的華為PuraX闊摺疊手機。

05月06日 1653

雷軍，職務調整！

5月5日，雷軍職務調整衝上微博熱搜。天眼查顯示，近日，小米之家商業有限公司發生工商變更，雷軍由執行董事改任董事，同時經營範圍新增智能家庭消費設備銷售、美髮飾品銷售。

05月06日 1436

雷軍2025年遭老罪了！卸任董事又遇車禍，小米這回還能挺住不？

2025年5月，小米之家工商信息悄摸兒變了——雷軍的職務從「執行董事」改成「董事」。就這倆字的變動，跟往輿論鍋里扔了顆炸彈似的，炸出一堆問號：雷總這是要放權了？小米是不是出啥大事兒了？咱今兒就掰開揉碎了，聊聊雷軍今年有多難，順便看看小米這船

05月06日 1230

美國加州新概念餐廳用機械人做漢堡，製作一個僅需27秒

IT之家 5 月 5 日消息，近日一家位於美國加利福尼亞州洛斯加托斯的新概念餐廳亮相，其核心特色是利用先進的機械人技術實現快速且精準的餐品組裝。

05月05日 1749

每年多賣1個億，河北三兄弟掘金外賣，3毛錢小東西年銷6億

最近，互聯網圈又熱鬧起來了！京東和美團在外賣領域火力全開，開啟了一場激烈的「戰爭」。這情景，不禁讓人想起多年前滴滴和快的那場燒錢大戰，每日數十萬張的大額優惠券瘋狂發放。

05月05日 1280

個人視頻被搬運上熱搜閱讀過億，「潑天的流量」令創作者害怕：不想被身邊人看到

近日，短視頻創作者「大福在成長」發佈自己失業後生活的視頻被搬運至其他平台，不僅上了熱搜，話題量還破億。「潑天的流量」卻並未讓她開心，因為自己本人並未授權，同時個人隱私還被「廣而告之」，她私信要求對方刪除卻未被理睬。近日，創作者向揚子晚報/紫牛新聞記者講述了自己艱難的維權過程。2024年11月份，博主「大福...

05月05日 6187

成熟的編程智能體，已經學會升級自己的系統了

編程智能體，幾乎成為了 2025 年最熱門的之一。不管是學術機構還是工業界，都在尋找更高效的落地路徑。機器學習領域的歷史經驗表明，手工設計的解決方案最終會被學習到的解決方案所取代。

05月05日 1600

蘋果推出 2025 彩虹系列Apple Watch錶帶

IT之家 5 月 5 日消息，蘋果今日推出新款 Apple Watch 彩虹版運動型錶帶、錶盤和 iPhone 與 iPad 牆紙。彩虹版運動型錶帶即日起接受訂購，配套的動態錶盤與牆紙近日將隨軟件更新發佈。每一條彩虹版運動型錶帶都由手工裝配而成，壓模成型的鮮艷條紋構成形狀大小不一的彩虹條狀圖案，呈現含蓄而又驚艷的多變效果。蘋果稱每一...

05月05日 9814

華生科技2024年財報亮眼，營收利潤雙增長，但研發項目延期引關注

5月4日，華生科技發佈2024年年報，公司實現營業收入3.52億元，同比增長46.94%；歸屬凈利潤4942.30萬元，同比增長77.91%。儘管業績顯著改善，但研發中心建設項目延期至2025年6月，引發市場對其執行力的質疑。一、業績大幅回升，但仍未恢復至歷史高點2024年，華生科技的營業收入和凈利潤均實現大幅增長，分別達到3.52億元和4...

05月05日 6992