读天才与算法:人脑与AI的数学思维笔记24_预测性文本生成器

躺柒 2024-05-10 20:34:47

1. 起源1.1. 人类讲故事可能起源于“假如……”这种问答结构1.2. 讲故事是人类做安全试验的一种方式1.2.1. 如果你问一个人“假如……”,其实是在探索你的行为对他可能带来的影响1.3. 最早出现的故事极有可能就源自我们对在周遭混乱的环境中寻找某种秩序的渴望,想要在这个残酷无情的宇宙中找到自身存在的意义1.3.1. 围坐在火堆旁分享当天的狩猎故事,可以帮助部落在第二天能获取更多的猎物1.3.2. 智人力量上的短板,在部落的集体智慧中得到了弥补1.3.3. 这种智慧的力量随着社交和分享的增加而增强1.3.4. 营地的篝火点燃了人类创造力的火种1.3.5. 这是一种早期的科学形式1.4. 算法能不能构想出其他有趣的动物以便推动故事情节的发展?1.4.1. 就像那些长有头、躯干和腿的动物一样,将不同事物的组成部分解构,然后再通过混合进行重构,就可以创造出千奇百怪的新事物1.4.2. 这些具有奇技异能的新生物是促使新故事诞生的极佳催化剂2. 预测性文本生成器2.1. 到目前为止,大多数例子都基于自上而下的编程思想2.1.1. 按照明确的规则,可随机填充单词的诗歌模2.1.2. 将经典作品转换为新作品的代码2.1.3. 通过编程获取数据并将其转化为故事的算法2.1.4. 这些程序实际上并没有太多自由发挥的空间2.2. 机器学习正在改变这一切2.2.1. 算法可以从小说作者的所有作品中学习,探索他们的写作方式2.2.2. 如果他们喜欢使用某个特定的词,这个词后面很可能会跟着其他出现频次高的词2.2.3. 通过构建作者使用单词的概率图,算法可以生成该作者作品的续篇2.2.4. 这就是预测性文本生成器的工作原理,其产出的文学作品既发人深省又引人入胜3. Botnik3.1. 一个名为“Botnik”的公司倡导使用机器学习来创造新文学3.1.1. 一家研发人工智能自然语言技术的公司3.1.2. 其致力于开发能与人协作的内容创作工具,即用人工智能挖掘人类的创造潜能3.2. 该公司由作家杰米·布鲁(Jamie Brew)和《纽约客》(The New Yorker)前漫画编辑鲍勃·曼考夫(Bob Mankoff)于2016年创立3.3. 算法有时会输出出人意料的超现实主义作品3.3.1. Botnik为《宋飞正传》写出了精彩的剧本3.3.2. Botnik还制作了一份感恩节食谱,并在YouTube上发布了一段视频,让人们了解如果把烹饪这件事交给算法3.4. Botnik在学习了《哈利·波特》七卷丛书之后,生成了三页几乎可以以假乱真的续集3.4.1. 有些时候,算法才是最纯粹的“天才”3.5. Botnik确实可以从构建句子的方式中学习、辨认、识记,但其所捕捉到的只是这样一个事实存在:作者的写作风格3.5.1. 只捕捉到了这一点:文本的局部,却没有从整体上考虑叙事结构3.5.2. 就像爵士乐的“续作者”一样,它可以生成一些以假乱真的乐句,但最终还是难逃走向乏味、无聊和枯竭,因为算法不知道该继续向何处发展音乐3.5.3. 小说家们很快就会失业是不大可能的4. Scheherazade-IF4.1. 2012年,乔治亚理工学院的马克·里德尔(Mark Riedl)和他的同事开发了一个会讲故事的算法“Scheherazade-IF”4.1.1. 这个算法名字中的“Scheherazade”来源于王后山鲁佐德为暴虐的国王讲故事来安抚他的传说,她是一位优秀的故事讲述者4.1.2. “IF”取自“Interactive Fiction”,意为交互式小说4.2. 目标是在故事发展可能性的迷宫中找到一条更加连贯畅通的路径4.3. 由于人类具备许多现实世界的知识,所以他们都是天生的、优秀的故事讲述者4.4. 如果你要求Scheherazade-IF构建一个关于某个特定主题或情境的故事,而这个主题或情境它之前从未遇到过,那么它就会通过搜集和消化之前的故事来进行学习4.5. Scheherazade-IF从由一大群人构成的大规模知识库中汲取新的信息并充分消化,再将这些范例汇总形成一个树状图,图中列出故事发展的各种可能方向4.5.1. 好的故事讲述者,会在故事发展树状图中找到最佳的路径4.5.2. 在很多故事情节会随玩家的选择而走向不同结局的开放性电脑游戏中,这种方法非常奏效4.6. Scheherazade-IF正尝试通过它在网上收集到的数据,生成故事发展的可能性树状图,进而实现这一点4.6.1. 它所做的选择获得的满意度得分可以与人类相媲美,远远高于随机生成的故事5. Whim5.1. What If Machine5.2. 由欧盟资助的Whim(What If Machine)项目所试图解决的问题5.2.1. 从网上搜罗以前的故事把它们重新组合在一起固然不错,但想象一下如果是前所未见的场景会有怎样的结果?5.3. 作家在尝试创造新作品时面临的一个问题是,他们会卡在自己有限的固定思维模式里5.3.1. Whim通过提供焕然一新的故事场景,把故事讲述者带出他们的舒适区5.4. 由Whim生成的一个故事情节,最终促成了一部音乐剧于2016年在伦敦西区上演5.4.1. 筛选算法分析音乐剧走红或惨败的原因,为Whim提供故事情节进一步发展的建议5.4.2. 2016年春天,《飞越藩篱》在伦敦西区的艺术剧院进行了短暂的演出5.4.2.1. 为完成这一作品,人类的干预可能和电脑的创造力一样多6. 普洛普写手6.1. PropperWryter6.2. 在生成童话故事方面,另一个算法“普洛普写手”(PropperWryter)更胜一筹6.3. 1928年,形式主义语言学家、民俗学家弗拉基米尔·普洛普(Vladimir Propp)在他的《故事形态学》里提出,俄国民间故事有31种叙事原型6.4. “普洛普写手”把Whim提供的情节最终发展成为一个关于格林汉姆普通妇女反核运动的故事6.4.1. 其音乐由另一个名为“机器人劳埃德·韦伯”(Android Lloyd Webber)的算法提供7. “自动化”数学家7.1. 数学家如果能提出诸如“假如……”这一类的问题,就意味着他距离突破知识边界已经只有一步之遥了7.1.1. 假如有一个数的平方值为–17.1.2. 假如弯曲空间中,两条平行线可以相交7.1.2.1. 黎曼几何7.2. 打破固有的结构框架,从变化中探索有价值的新发现,是编写新的数学“故事”的经典工具7.3. 如果数学是用数字讲述的故事,那么目前的算法在生成新的数学故事方面有多大的价值呢?8. 整数序列在线百科全书8.1. oeis dot org8.2. 其目的旨在收集所有有趣的数列,并探索生成这些数列的公式或方法8.3. 由素数(或者说除了1和它本身以外不再有其他因数的自然数)构成的数列8.3.1. 对于该数列,很难找到一个通项公式来生成下一个数,这也是数学界公认的未解之谜之一8.4. 可重分解因子数是一项由机器生成的发明8.4.1. 可重分解因子数”(refactorable numbers)的概念,其定义为:数列中每个数字的因数个数,本身又是该数字的因数8.4.2. 该数列中的奇数,被称为“奇数可重分解因子数”8.4.2.1. odd refactorable numbers8.4.3. 算法推测:所有的奇数可重分解因子数都是完全平方数
0 阅读:0

躺柒

简介:书既能读薄也能读厚,输出才能检验输入,完成才能完善。