tft每日頭條

 > 科技

 > 怎麼把數據進行離差标準化

怎麼把數據進行離差标準化

科技 更新时间:2025-09-09 02:35:07

在統計學中,标準分數是原始分數(即觀察值或數據點)的值高于或低于正在觀察或測量的平均值的标準偏差數。高于平均值的原始分數具有正标準分數,而低于平均值的原始分數具有負标準分數。

标準分數的計算方法是從單個原始分數中減去總體平均值,然後将差值除以總體标準差。将原始分數轉換為标準分數的過程稱為标準化或标準化。

結合偏差是變量的觀察值與其他值之間差異的度量,通常是該變量的平均值。偏差的符号(正或負)報告差異的方向(當觀察值超過參考值時偏差為正),值的大小表示差異的大小。

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)1

标準計分和離差應用方法标準化和标準計分

标準計分又稱作标準分數。一份學生的成績表單,琉衣的英語90分和由美的90分同樣都是90分,有沒有辦法比較其對應成績的含金量呢?

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)2

通過計算每科的平均分數,英語=81.3,古文=74.3。看看她們各自超越平均分的一個情況就一目了然了。

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)3

但是如果平均分數相同的情況下、分數也相同的情況下應該如何衡量?

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)4

可以計算标準差,曆史=22.7,生物=18.3。标準差越小反應該組數據離散程度越小,反之亦然。離散程度的高低決定了該組數據的重要性。離散程度低的數組比離散程度高的數據更加重要,說通俗一些就是離散度低的數組即生物成績比較值錢。

如果進行标準化處理就會變得非常簡單了,也就是制作 标準分數

  • 也稱标準化值,是對某一個值在一組數據中相對位置的度量。
  • 可用于判斷一組數據是否有離群點(outlier),用于對變量的标準化處理。

Zi=x1−x¯S

标準計分每數據均值标準差标準計分=每數據−均值标準差

根據上面的案例計算标準分數。分值高的則反應對應的數據比較值錢。

琉衣曆史标準分數 = (73-53)/ 22.7 = 0.88 由美生物标準分數 = (73-53)/ 18.3 = 1.09

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)5

在這裡插入圖片描述

标準計分特征

對于均值樣本來說,總體區間和單位不同的場景都是可以使用标準計分進行比較。

  • 無論作為變量的滿分為幾分,其标準計分的平均數勢必為0,而其标準差勢必為1。例如考試滿分100分和150分也是可以進行比較。
  • 無論作為變量的單位是什麼,其标準計分的平均數勢必為0,而其标準差勢必為1。例如足球裡射門次數和入球次數相同的情況也是可以進行比較
離差

離差是應用标準計分所得的數值。

  • 無論作為變量的滿分為幾分,其離差的平均數勢必為50,而其标準差勢必為10。
  • 無論作為變量的單位是什麼,其标準計分的平均數勢必為50,而其标準差勢必為10。

離差 = 标準計分*10 50

對于上面琉衣的曆史成績和由美的生物成績進行對比。

琉衣曆史标準分數 = (73-53)/ 22.7 = 0.88 琉衣曆史離差 = 0.88 * 10 50 = 58.8

由美生物标準分數 = (73-53)/ 18.3 = 1.09 由美生物離差 = 1.09 * 10 50 = 60.9

這個和标準計分反應的結果是一樣的。

《三國志》武将屬性能力應用

遊戲中的原始數據是這樣的,目标計算各個屬性 TOP 1 中的人物,誰的能力更加出色。

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)6

篩選出來個各項數據TOP 1的武将

統率:司馬懿

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)7

武力:呂布

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)8

智力:諸葛亮

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)9

政治:荀彧

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)10

魅力:劉備

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)11

計算每個項目對應的均值和标準差

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)12

單項數據計算結果和排名

怎麼把數據進行離差标準化(入行數據分析要知道什麼是标準計分)13

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved