智能需要数据
人类智能需要数据:
房地产经纪人需要有关已售房屋的数据来估算价格。
人工智能需要数据:
计算机程序也需要数据来估算价格。
存储数据
要收集的最常见数据是数字和测量值。
数据通常存储在表示值之间关系的数组中。
此表包含房价与大小:
Price 7 8 8 9 9 9 10 11 14 14 15
Size 50 60 70 80 90 100 110 120 130 140 150
定量与定性
定量数据是数值:
55 辆汽车
15 米
35 个孩子
定性数据是描述性的:
天冷了
很长
很有趣
人口普查或抽样
人口普查是指我们为一个群体的每个成员收集数据。
样本是我们为某个组的某些成员收集数据的时候。
如果我们想知道有多少美国人吸烟,我们可以询问美国的每个人(人口普查),或者我们可以询问 10 000 人(样本)。
人口普查准确,但很难做到。 样本不准确,但更容易做到。
抽样说明
人口是我们想要从中收集信息的一组个体(对象)。
人口普查是关于人口中每个人的信息。
样本是关于一部分人口的信息(为了代表所有人)。
随机样本
为了让一个样本代表一个总体,它必须是随机收集的。
随机样本,是一个样本,总体中的每个成员都有相同的机会出现在样本中。
抽样偏差
抽样偏差(错误)发生在样本的收集方式使得某些个体不太可能(或更多)包含在样本中时。
|