编者按:本文来自微信大众号“学术头条”(ID:SciTouTiao),作者:曹绮桐,36氪经授权发布。
假如了解一个家庭的经济实力、教育水平、日子环境等根底情况数据,你能猜测未来十年或许二十年的日子姿态吗?
答案是可想而知的 —— 究竟杂乱的社会网络、难测的日子阅历,以及每个带有个人片面性质的小小决议,都有或许对未来日子形成不可逆转的方向的改动。
可是,当具有许多根底数据后,咱们或许能够判别个人在特定日子环境下怎样生长或许趋向性做出怎样的决议,某个事情关于家庭会形成怎样活跃或许消沉的影响, 这或许就会让不或许变成或许。
而 AI 强壮的剖析数据的才能,给这种猜测未来的或许带来了一丝曙光。
现在,科学家们正开端在这一范畴的测验。
来自普林斯顿大学 (Princeton University) 与弗吉尼亚理工大学 (Virginia Tech) 等多家组织的研讨人员协作进行的一项大规模研讨,经过树立计算和机器学习模型来猜测和衡量美国各地儿童、爸爸妈妈和家庭的日子成果,这个大规模的协作项目被称为 “软弱的家庭应战”。
来自弗吉尼亚理工大学弗拉林生命科学研讨所的研讨科学家 Brian Goode 是软弱家庭应战中的数据和社会科学家之一。“这是一项尽力,企图捕捉数据和模型中构成人类日子结构的杂乱性和杂乱性。可是,为了更好地揣度猜测的不确认性和局限性,有必要采纳下一步举动,将模型置于怎么运用它们的环境中。这是一个很难处理的问题,我以为软弱家庭的应战标明,咱们应该在这一范畴供给更多的研讨支撑,特别是在机器学习对咱们日常日子发生更大影响的情况下。”Brian Goode 说道。
Goode 博士
该研讨对 1998 年至 2000 年间出世在美国大城市的约 5000 名儿童进行了研讨,其间未婚爸爸妈妈所生儿童的样本数量过多。这项纵向研讨的意图是了解出世在未婚家庭的孩子的日子。
经过搜集六次查询 (孩子出世的时刻,然后孩子长到 1、3、5、9、15 岁时),这项研讨现已搜集了数百万关于儿童及其家庭的数据点。另一组数据将在孩子们 22 岁时被获取。
在研讨人员规划这个项意图时分,15 岁的数据 (研讨人员在论文中称其为 “保存数据”) 还没有揭露。这一起也发明了一个时机,让其他科学家经过大规模协作来猜测研讨方针的日子成果。
联合组织者收到了来自世界各地 68 所大学的 457 份请求,这中心还包括来自普林斯顿的几个团队。运用该项意图家庭数据,参加者被要求猜测 15 岁时六种日子成果中的一种或多种。这中心还包括儿童均匀绩点 (GPA)、孩子意志、家庭物质困难、首要照料者裁人、首要照料者参加作业训练等。
麦克拉纳汉是普林斯顿大学和哥伦比亚大学 “软弱家庭与儿童健康研讨”(Fragile Families and Child happiness Study) 的首席研讨员。“刚开端的时分,我真的不知道什么是大规模协作,但我知道把咱们的数据介绍给一组新的研讨人员是个好主意, 那就是数据科学家,” 麦克拉纳汉说。
“成果让人大开眼界,” 她说,“要么运气在人们的日子中扮演着重要人物,要么咱们作为社会科学家的理论遗漏了一些重要的变量。”
这项应战是根据 “一起任务法”,这是一种在计算机科学中常常运用的研讨规划,但在社会科学中却不常用。这种办法释放了部分但不是悉数的数据,答应人们运用任何他们想要的技能来确认成果。方针是精确地猜测保存的数据,不论到达这个方针需求多么杂乱的技能。
研讨成果由 112 名一起作者宣布在《美国国家科学院院刊》(PNAS) 杂志上。成果标明,即便运用了最先进的建模技能和包括 4000 多个家庭 1.3 万个数据点的高质量数据集,最好的人工智能猜测模型也不是很精确。因而,社会学家和数据科学家关于 AI 猜测模型时应慎重运用,尤其是在刑事司法体系和社会项目中。
弗吉尼亚理工大学的研讨小组还在美国社会学协会 (American Sociological Association) 新出书的敞开获取期刊《社会学》(Socius) 的一期特刊上宣布了研讨成果。为了支撑这一范畴的进一步研讨,一切提交的应战 —— 代码、猜测和叙事解说 —— 都是揭露的。
研讨人员标明,成果向咱们标明,咱们有许多要学,科学家用来猜测大数据集成果的机器学习技能,在猜测人们的日子成果方面或许存在缺乏。
参考资料:
https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php
https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php