X$ P+ C& L" }# U: `+ u# }3 z8 J 如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
h- ^4 Y; a; @6 M$ T8 B 1. 字段信息统计
/ p% g* E% ^2 R) a0 H 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
; e. ]3 i5 A: Y {
+ {4 e% {# T/ s3 ]7 c9 }3 c
7 H" Q% I4 k! \, {6 Y 打开凤凰新闻,查看更多高清图片
. z4 I/ } x3 F. Q" b# Y" u
8 k1 S- U- c# x3 j) O; O$ S E! \5 }6 F" c) S; `! h
2. 筛选生成新表
% @: `: D: U1 @5 q) \- r: g$ `
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
. h6 \. S, R' K8 ?2 }) d$ w: N 
5 O5 i# t# Q: @) K6 n+ k% I 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
8 y# X6 y- k$ o' G# z

- p9 @% |. j8 y+ ?' U: s5 m1 \ 3. 生成关联数据
- V+ q3 |5 p/ |$ L6 Z9 Y1 ~; H
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
. g% d9 U) @" q: R8 F+ K' E6 a. s( W5 h
1. 选择表做关联关系
1 P7 O( ?# v0 T' F+ Z( n

8 ~7 Q6 V2 @) ^& C2 M4 L8 {. H* G
2. 设置关联关系类型及关联字段
# B2 e h9 l$ b% J& m9 q

6 q) O/ `& }: O: l- M8 Q 3. 选择最终生成关联新表数据需要的字段
/ {- s$ N+ V( J" o( l$ \# L6 A- X( W

0 N# o: F7 r( R3 R+ l 4. 主题表数据追加覆盖
8 a9 k) s! r, f2 g0 I 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
# M7 R- C ^8 v [: ~
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
" O; d7 Y: d* A. |/ O9 C( m

9 V6 i9 @+ K& T% r3 c$ M4 i& ^
2. 选择文件数据源中的文件,点击追加或覆盖
0 N& C- `/ R: T* ~5 M1 X 
6 ]/ _7 ^9 _2 b/ j8 j7 _ 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
m" C+ Z. U9 j% s- V: v 
/ `5 [( u- U/ f8 s6 }6 n% K
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
3 u2 o3 V& r# S2 u 
. U4 s+ `) `: ]( {; s 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
1 K3 w8 u% `! ~& [" k, K* E% ~! F1 j 
' q; j$ J( P- H3 M
也可针对某一个字段自行选择设置字段对应关系
: J% C% C1 B" O( Y 
6 }/ Q0 D" {, a8 [4 C 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
' g3 Y5 F5 ?3 \+ b O9 j) X