Discuz! Board

 找回密碼
 立即註冊

QQ登入

只需一步,快速開始

搜尋
熱搜: 活動 交友 discuz
檢視: 150|回覆: 0

大資料應用測試的關鍵考慮因素

[複製連結]

2

主題

2

帖子

8

積分

新手上路

Rank: 1

積分
8
發表於 2023-11-2 15:28:01 | 顯示全部樓層 |閱讀模式
2016年即將成為大資料年。那些利用大資料的人一定會領先,而那些不利用大資料的人肯定會落後。根據 Viewpoint 報告,“76%(的組織)計劃在 2 至 3 年內增加或維持對大資料的投資”。來自社交網路、移動裝置、CRM 記錄、購買歷史等的資料為公司提供了寶貴的見解,以發現隱藏的模式,幫助企業繪製其成長故事。顯然,當我們談論資料時,我們談論的是幾乎達到 PB、EB、有時甚至澤位元組的海量資料。除了數量巨大之外,這些來自不同來源的資料也需要以與組織相關的速度進行處理。為了使這些企業資料有用,必須通過應用程式將其投射給使用者。

大資料應用測試
與所有其他應用程式一樣,測試也是大資料應用程式的重要組成部分。然而,測試大資料應用程式更多地涉及資料驗證,而不是測試單個功能。在測試大資料應用程式時,我們需要跨越一些障礙。

由於資料資訊是從不同的來源獲取的,為了使其有用,需要實時整合。這可以通過對資料來源進行端到端測試來實現,以確保所使用的資料是乾淨的,資料取樣和資料編目技術是正確的,並且應 奈及利亞手機號碼列表 用程式不存在可擴充套件性問題。除此之外,還必須對應用程式進行徹底測試以促進實時部署。



對於測試人員來說,最重要的是測試大資料應用程式,從而成為資料本身。在測試大資料應用程式時,測試人員需要深入研究模式不斷變化的非結構化或半結構化資料。這些應用程式也無法像資料倉庫應用程式中那樣通過“取樣”進行測試。由於大資料應用包含非常大的資料集,因此必須在研發的幫助下完成測試。那麼測試人員如何測試大資料應用程式呢?

首先,大資料應用的測試要求測試人員使用聚類方法來驗證大量資料。資料可以互動式、實時或批量處理。檢查資料質量對於檢查準確性、重複性、有效性、一致性、完整性等也變得至關重要。我們可以將大資料應用測試大致分為三個基本類別:

大資料應用測試的類別
資料驗證:
資料驗證也稱為Hadoop 前測試,可確保從正確的來源收集正確的資料。完成此操作後,資料將被推送到 Hadoop 系統並與源資料進行統計,以確保它們在該系統中匹配並被推送到正確的位置。
業務邏輯驗證:
業務邏輯驗證是對“MapReduce”的驗證,這是Hadoop的核心。在此驗證過程中,測試人員必須驗證每個節點上的業務邏輯,然後針對多個節點進行驗證。這樣做是為了確保MapReduce過程正常工作、正確實現資料隔離和聚合規則以及正確生成鍵值對。
輸出驗證:
這是大資料測試的最後階段,生成輸出資料檔案,然後將其移動到所需的系統或資料倉庫。在這裡,測試人員檢查資料完整性,確保資料成功載入到目標系統中,並通過比較 HDFS 檔案系統資料與目標資料來保證不存在資料損壞。
架構測試是大資料測試的重要組成部分,因為糟糕的架構會導致效能不佳。此外,由於 Hadoop 資源極其密集並處理大量資料,因此架構測試變得至關重要。除此之外,由於大資料應用程式涉及大量資料轉移,因此效能測試在識別以下方面發揮著更重要的作用:

記憶體利用率
作業完成時間
資料吞吐量
在效能測試方面,測試人員必須採用非常結構化的方法,因為它涉及測試大量結構化和非結構化資料。測試人員必須確定系統消耗來自不同資料來源的資料的速率以及執行 Map-Reduce 作業或查詢的速度。除此之外,測試人員還必須檢查子元件的效能並檢查每個單獨元件的獨立效能。

回覆

使用道具 舉報

您需要登入後才可以回帖 登入 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|DiscuzX

GMT+8, 2024-11-27 10:44 , Processed in 0.013934 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回復 返回頂部 返回列表