本节中的所有函数接受零或一个参数。该参数(如果提供的话)唯一的作用是防止 常见子表达式消除,使得在同一行中对同一随机函数的两次不同执行返回不同的随机值。
相关内容
rand
返回一个均匀分布的随机 UInt32 数字。
使用线性同余生成器,其初始状态来自系统,这意味着它看似随机,但并不是完全随机的,如果知道初始状态,则可以预测。在需要真正随机性至关重要的场景下,可以考虑使用系统级调用或与外部库集成等替代方法。
语法
别名: rand32
参数
无。
返回值
返回 UInt32 类型的数字。
示例
1569354847 -- Note: The actual output will be a random number, not the specific number shown in the example
rand64
返回一个随机的 UInt64 整数 (UInt64) 数字。
语法
参数
无。
返回值
返回一个均匀分布的 UInt64 数字。
使用线性同余生成器,其初始状态来自系统,这意味着它看似随机,但并不是完全随机的,如果知道初始状态,则可以预测。在需要真正随机性至关重要的场景下,可以考虑使用系统级调用或与外部库集成等替代方法。
示例
15030268859237645412 -- Note: The actual output will be a random number, not the specific number shown in the example.
randCanonical
返回一个随机的 Float64 数字。
语法
参数
无。
返回值
返回一个介于 0(包括)和 1(不包括)之间的 Float64 值。
示例
0.3452178901234567 - Note: The actual output will be a random Float64 number between 0 and 1, not the specific number shown in the example.
randConstant
生成一个填充随机值的单个常量列。与 rand
不同,此函数确保在生成列的每一行中都出现相同的随机值,使其在需要在单个查询中跨行保持一致随机种子的场景中特别有用。
语法
参数
- [x](可选): 一个可选表达式,影响生成的随机值。即使提供,结果值在同一查询执行中仍将保持不变。使用相同表达式的不同查询可能会生成不同的常量值。
返回值
返回一个类型为 UInt32 的列,每一行都包含相同的随机值。
实现细节
实际输出在每次查询执行中会有所不同,尽管使用相同的可选表达式。可选参数可能不会显著改变生成的值,与单独使用 randConstant
相比。
示例
SELECT randConstant() AS random_value;
| random_value |
|--------------|
| 1234567890 |
SELECT randConstant(10) AS random_value;
| random_value |
|--------------|
| 9876543210 |
返回一个均匀从区间 [min
, max
] 中抽取的随机 Float64。
语法
参数
min
- Float64
- 范围的左边界,
max
- Float64
- 范围的右边界。
返回值
返回类型为 Float64 的随机数字。
示例
SELECT randUniform(5.5, 10) FROM numbers(5)
┌─randUniform(5.5, 10)─┐
│ 8.094978491443102 │
│ 7.3181248914450885 │
│ 7.177741903868262 │
│ 6.483347380953762 │
│ 6.122286382885112 │
└──────────────────────┘
randNormal
返回一个从 正态分布 中抽取的随机 Float64。
语法
参数
mean
- Float64
- 分布的均值,
stddev
- Float64
- 分布的 标准差。
返回值
示例
SELECT randNormal(10, 2) FROM numbers(5)
结果:
┌──randNormal(10, 2)─┐
│ 13.389228911709653 │
│ 8.622949707401295 │
│ 10.801887062682981 │
│ 4.5220192605895315 │
│ 10.901239123982567 │
└────────────────────┘
randLogNormal
返回一个从 对数正态分布 中抽取的随机 Float64。
语法
randLogNormal(mean, stddev)
参数
mean
- Float64
- 分布的均值,
stddev
- Float64
- 分布的 标准差。
返回值
示例
SELECT randLogNormal(100, 5) FROM numbers(5)
结果:
┌─randLogNormal(100, 5)─┐
│ 1.295699673937363e48 │
│ 9.719869109186684e39 │
│ 6.110868203189557e42 │
│ 9.912675872925529e39 │
│ 2.3564708490552458e42 │
└───────────────────────┘
randBinomial
返回一个从 二项分布 中抽取的随机 UInt64。
语法
randBinomial(experiments, probability)
参数
experiments
- UInt64
- 实验次数,
probability
- Float64
- 每次实验成功的概率,值介于 0 和 1 之间。
返回值
示例
SELECT randBinomial(100, .75) FROM numbers(5)
结果:
┌─randBinomial(100, 0.75)─┐
│ 74 │
│ 78 │
│ 76 │
│ 77 │
│ 80 │
└─────────────────────────┘
randNegativeBinomial
返回一个从 负二项分布 中抽取的随机 UInt64。
语法
randNegativeBinomial(experiments, probability)
参数
experiments
- UInt64
- 实验次数,
probability
- Float64
- 每次实验失败的概率,值介于 0 和 1 之间。
返回值
示例
SELECT randNegativeBinomial(100, .75) FROM numbers(5)
结果:
┌─randNegativeBinomial(100, 0.75)─┐
│ 33 │
│ 32 │
│ 39 │
│ 40 │
│ 50 │
└─────────────────────────────────┘
randPoisson
返回一个从 泊松分布 中抽取的随机 UInt64。
语法
参数
返回值
示例
SELECT randPoisson(10) FROM numbers(5)
结果:
┌─randPoisson(10)─┐
│ 8 │
│ 8 │
│ 7 │
│ 10 │
│ 6 │
└─────────────────┘
randBernoulli
返回一个从 伯努利分布 中抽取的随机 UInt64。
语法
randBernoulli(probability)
参数
probability
- Float64
- 成功的概率,值介于 0 和 1 之间。
返回值
示例
SELECT randBernoulli(.75) FROM numbers(5)
结果:
┌─randBernoulli(0.75)─┐
│ 1 │
│ 1 │
│ 0 │
│ 1 │
│ 1 │
└─────────────────────┘
randExponential
返回一个从 指数分布 中抽取的随机 Float64。
语法
参数
lambda
- Float64
- lambda 值。
返回值
示例
SELECT randExponential(1/10) FROM numbers(5)
结果:
┌─randExponential(divide(1, 10))─┐
│ 44.71628934340778 │
│ 4.211013337903262 │
│ 10.809402553207766 │
│ 15.63959406553284 │
│ 1.8148392319860158 │
└────────────────────────────────┘
randChiSquared
返回一个从 卡方分布 中抽取的随机 Float64 - 一组 k 个独立标准正态随机变量的平方和的分布。
语法
randChiSquared(degree_of_freedom)
参数
degree_of_freedom
- Float64
- 自由度。
返回值
示例
SELECT randChiSquared(10) FROM numbers(5)
结果:
┌─randChiSquared(10)─┐
│ 10.015463656521543 │
│ 9.621799919882768 │
│ 2.71785015634699 │
│ 11.128188665931908 │
│ 4.902063104425469 │
└────────────────────┘
randStudentT
返回一个从 学生 t 分布 中抽取的随机 Float64。
语法
randStudentT(degree_of_freedom)
参数
degree_of_freedom
- Float64
- 自由度。
返回值
示例
SELECT randStudentT(10) FROM numbers(5)
结果:
┌─────randStudentT(10)─┐
│ 1.2217309938538725 │
│ 1.7941971681200541 │
│ -0.28192176076784664 │
│ 0.2508897721303792 │
│ -2.7858432909761186 │
└──────────────────────┘
randFisherF
返回一个从 F 分布 中抽取的随机 Float64。
语法
参数
d1
- Float64
- X = (S1 / d1) / (S2 / d2)
中的 d1 自由度,
d2
- Float64
- X = (S1 / d1) / (S2 / d2)
中的 d2 自由度,
返回值
示例
SELECT randFisherF(10, 3) FROM numbers(5)
结果:
┌──randFisherF(10, 3)─┐
│ 7.286287504216609 │
│ 0.26590779413050386 │
│ 0.22207610901168987 │
│ 0.7953362728449572 │
│ 0.19278885985221572 │
└─────────────────────┘
randomString
生成一个指定长度的字符串,填充随机字节(包括零字节)。并非所有字符都可能是可打印的。
语法
参数
length
— 字符串长度,以字节为单位。正整数。
返回值
示例
查询:
SELECT randomString(30) AS str, length(str) AS len FROM numbers(2) FORMAT Vertical;
结果:
Row 1:
──────
str: 3 G : pT ?w тi k aV f6
len: 30
Row 2:
──────
str: 9 ,] ^ ) ]?? 8
len: 30
randomFixedString
生成一个指定长度的二进制字符串,填充随机字节(包括零字节)。并非所有字符都可能是可打印的。
语法
randomFixedString(length);
参数
length
— 字符串长度,以字节为单位。 UInt64。
返回值
示例
查询:
SELECT randomFixedString(13) AS rnd, toTypeName(rnd)
结果:
┌─rnd──────┬─toTypeName(randomFixedString(13))─┐
│ j▒h㋖HɨZ'▒ │ FixedString(13) │
└──────────┴───────────────────────────────────┘
randomPrintableASCII
生成一个随机的 ASCII 字符串。所有字符都是可打印的。
如果您传递 length < 0
,则函数的行为未定义。
语法
randomPrintableASCII(length)
参数
length
— 字符串长度,以字节为单位。正整数。
返回值
示例
SELECT number, randomPrintableASCII(30) AS str, length(str) FROM system.numbers LIMIT 3
┌─number─┬─str────────────────────────────┬─length(randomPrintableASCII(30))─┐
│ 0 │ SuiCOSTvC0csfABSw=UcSzp2.`rv8x │ 30 │
│ 1 │ 1Ag NlJ &RCN:*>HVPG;PE-nO"SUFD │ 30 │
│ 2 │ /"+<"wUTh:=LjJ Vm!c&hI*m#XTfzz │ 30 │
└────────┴────────────────────────────────┴──────────────────────────────────┘
randomStringUTF8
生成一个指定长度的随机字符串。结果字符串包含有效的 UTF-8 码点。码点的值可能超出分配 Unicode 的范围。
语法
randomStringUTF8(length);
参数
返回值
示例
查询:
SELECT randomStringUTF8(13)
结果:
┌─randomStringUTF8(13)─┐
│ 𘤗д兠庇 │
└──────────────────────┘
fuzzBits
语法
翻转字符串或固定字符串 s
的位,概率为 prob
。
语法
参数
s
- String
或 FixedString
,
prob
- 介于 0.0 和 1.0 之间的常数 Float32/64
。
返回值
模糊后的字符串,其类型与 s
相同。
示例
SELECT fuzzBits(materialize('abacaba'), 0.1)
FROM numbers(3)
结果:
┌─fuzzBits(materialize('abacaba'), 0.1)─┐
│ abaaaja │
│ a*cjab+ │
│ aeca2A │
└───────────────────────────────────────┘