常识02:阈值还是阀值

数据分析 BI工具 阈值概念 工业术语 数学应用
在数据分析领域,**阈值**和**阀值**常被混淆,但两者含义不同。阈值(Threshold)源自工业场景,指测量值的对比点,用于触发警报或决策,如销售额增速低于10%时标记为红色。而阀(Valve)是控制系统的执行器,用于调节流量。知乎用户Thinkraft指出,阀值是误用,阈值的正确性应被认可。实际应用中,阈值通常为整数,便于直观理解,如人口达到10万才称为城市。数学中的拐点、极值点与阈值无直接关系。
文章内容
思维导图
常见问题
社交分享

从事数据分析,尤其是BI相关工作的读者一定对阈值或者阀值这个概念不陌生。

数据分析师的日常工作中需要根据不同的数值,做不同的决策,或者做可视化的设置。比如当销售额或者其他核心指标增速低于20%,就把指标或者这个增速指标的颜色配置成黄色;增速低于10%,配置成红色;以及根据这些数值把这些异常情况作为预警发送出去,情况越严重,要预警的对象层级就越高。

回到本文的话题,这些10%,20%到底是叫阈值还是阀值呢? 这在数据分析师圈子里,也是一个争论了好久的话题。在这本小册子里,我们还是认可阈值(yu,第四声)这个叫法。

在海外的BI产品里,这个概念一般都对应**Threshold **这个单词。这个词最初来自于工业场景,是测量值的一个对比值。然后这个对比值会被设置到机器中。比如当一个设备的压力超过了某一个指标,就会显示红灯,或者发起警报。

而阀,通常指阀门的缩写,对应英文单词 Valve,这也是工业控制系统里的一个概念。但是阀门是一个执行器。阀门可以被人工或者被机器操控,或是完全打开,或者完全关闭,或是半开半闭,从而影响下游的生产。

知乎用户Thinkraft也给出了他的答案答案就是阈值,阀值是一种误用。他讲得比较直白,认为因为选了一个跟「阀」字形很相近的一个词 ——「阈」来表达这个含义,造成被误读的可能性就大大提升了;而人们又不容易承认自己的错误,相反还会找一堆理由来解释错误的合理性。

当然,完整的自动化系统中既有测量也有控制,它们可以协同工作,但依然是两码事。 打个比方,显示器和键盘是两个不同的东西,就算绑到一起(如笔记本电脑),或者干脆融合(触控屏),你还是知道它们不是一回事,对么?那些大爷大妈管显示器叫电脑或者管键盘叫电脑时,你是怎么想的,感受一下我看你们把阀和阈搞混时的心情。 valve和threshold在工业上都是常用的术语。valve(阀)是控制系统中的组件,而threshold(阈值)这个则是测量中的信号点。看着像,区别老大了,所以才更要用不同的字翻译,防止有人把它俩搞混成一个东西。从这个角度「阈」这个字选得或许有些失败,字形太相近——但也无可厚非,你看氢和氧长得那么像也没见谁念错,终究还是念错者知识水平问题,不认识阈字,自己瞎理解念成阀,再强词夺理。

阈值与数学的关系

实际运用中,数据分析师设置阈值的时候一般都会用整数,因为这样用户看数,消费数据的人能有直观的理解。华大基因CEO尹烨在圆桌派的一期节目里提到,

一个地方的人口达到10万,才够格叫城市;一个地方人口有50万,才有可能发生传染病。

这里的10万,50万,其实就是是阈值的概念。 当然使用最广的阈值应该是0,0往上是正数,0往下是负数。资本市场的涨跌幅,就按照这个阈值来决定是显示红色或者绿色。

对了,我们做个小调查,在你们公司销售业绩增长是用红色表示,还是用绿色表示呢?

美股2021年年初至某日涨跌幅情况 2021.12.3

此外,数学里有也有拐点、极值点这些概念,不过他们与阈值并没有直接关系。

参考资料

思维导图生成中,请稍候...

问题 1: 在数据分析中,阈值和阀值有什么区别?
回答: 阈值(Threshold)是测量值的一个对比值,用于判断是否触发某种行为或警报;而阀值(Valve)是指阀门,是控制系统中的执行器,用于调节流量或压力。两者在功能和应用场景上有本质区别。

问题 2: 为什么在数据分析中更推荐使用“阈值”而不是“阀值”?
回答: 因为“阈值”是英文“Threshold”的正确翻译,而“阀值”是对“Valve”的误用。阈值用于描述测量和判断的标准,而阀值则与阀门控制相关,两者不应混淆。

问题 3: 阈值在数据分析中的具体应用场景有哪些?
回答: 阈值常用于设置预警或可视化规则,例如当销售额增速低于20%时标记为黄色,低于10%时标记为红色,并根据这些数值触发不同层级的预警。

问题 4: 阈值的概念最初来源于哪里?
回答: 阈值的概念最初来源于工业场景,用于测量设备的压力或其他指标,当超过设定值时触发警报或显示红灯。

问题 5: 为什么数据分析师在设置阈值时通常使用整数?
回答: 使用整数可以让用户更直观地理解数据,例如人口达到10万才称为城市,50万可能发生传染病,这些整数阈值便于快速判断和决策。

问题 6: 阈值与数学中的拐点、极值点有什么关系?
回答: 阈值与拐点、极值点没有直接关系。阈值是用于判断的标准值,而拐点和极值点是数学中描述函数变化特性的概念。

问题 7: 在资本市场的涨跌幅中,阈值是如何应用的?
回答: 在资本市场中,0通常作为阈值,0以上显示为绿色(上涨),0以下显示为红色(下跌),用于直观反映市场表现。

问题 8: 为什么“阈”字容易被误读为“阀”?
回答: 因为“阈”和“阀”字形相近,且“阈”字较为生僻,导致一些人误读为“阀”,并试图为自己的错误寻找合理性解释。

问题 9: 在自动化系统中,阈值和阀门如何协同工作?
回答: 在自动化系统中,阈值用于测量和判断是否触发警报或行为,而阀门用于执行控制操作(如打开或关闭)。两者虽然协同工作,但功能完全不同。

问题 10: 在销售业绩增长的可视化中,红色和绿色分别代表什么?
回答: 红色和绿色的具体含义因公司而异,通常红色表示业绩下降或未达标,绿色表示业绩增长或达标,但具体规则需根据公司内部标准确定。