我们可以在他的标点符号中识别作家吗?博客文章

作者:查疠

<p>什么使作家的风格</p><p>当然还有的话,公式,员工时间,程度和句子的活泼,等的选择,但也有散在的这一切中间,那些小的迹象,使粘合剂,速度和,有时候,“风景”迹象表明疑问,喜怒标点符号他们也都是“小乐”亲爱的路易 - 费迪南·塞利纳当然,他们不会被忽视的一部分因此,文学学者的文章中,我们发现在普鲁斯特用括号和席琳著名三点我在这里提到,是因为我有很长一段时间的问题(不像这个博客有时可以暗示什么,我做过文学研究,而不是科学......):我们能不能用他的任何单词来识别作者,只有他的标点符号</p><p>这归结为点,逗号,感叹号和问号等的图像是否是足够的雄辩从另一个问题区分不同的作者在我的大脑无人过问睡了年龄和当我看到Adam Calhoun的帖子时,它回到了表面</p><p>最初,Adam做数学和计算机科学,他“转变”为神经科学 - 特别是所谓的神经科学在普林斯顿大学(美国)他写了一个简短的程序,只保留文本的标点符号,并在清晰的网格上显示收集的数据他显然在他的作品上写了他的文章</p><p>盎格鲁撒克逊文学,他非常友好地接受我的要求,在我提供给他的法国作家的一些着名文本上运行他的程序这里有两个例子这给:从“Guermantes”普鲁斯特©亚当·卡尔霍恩开始“死亡的”路易 - 费迪南·塞利纳©亚当·卡尔霍恩我相信,在视觉上,实验的结果当然是我'醒目选择了每个作者一个非常特有的风格,不是说在他的“癫狂”四不像跳眼,普鲁斯特,乘逗号和插补(破折号和括号),尤其是相对稀缺点的所有信号那句著名的普鲁斯特长和抽屉相反,在席琳,点是共同的,这表明句子很短,当解说员开始赛车,三个点出现集群(最多6列在此提取物)和感叹号死亡的作者口头上,并提出了很多节奏在他的著作,使几乎所有其他标点符号消失我想继续实验...和你一起下面是法国文学的三个着名摘录,但很明显没有你能够识别他们的作者,甚至是有问题的作品吗</p><p>该测试是困难的,但它是值得一试,如果只为游戏和挑战的乐趣...摘录1,由分号大师小说的开始......摘录2©亚当·卡尔霍恩警告有陷阱......尽管出场,这是一个独白......©亚当·卡尔霍恩样品3个其他小说处女作破折号这里表示的对话,而不是切开©亚当·卡尔霍恩我请你留下你的建议,对于这些提取物,在评论这些,如果他们是对的谁也看或给他们的舌头猫,这里是显示答案的链接页面...皮埃尔巴泰勒米(按照我的Twitter这里或在Facebook上)PS:我非常感谢Adam Calhoun花时间让他的程序适应法语(用他的引语......)和我的愿望(将暂停点显示为单一标志)</p><p>这个合作ntenu作为不合适你可以带来纠正者语言舌头辛辣(世界的其他博客)和他们的常客,他们会喜欢这个游戏,我认为坦率地说有趣的研究,但它会在现代文学的专家,以确定几十个作家的法国文学很出名之中......我鼓掌那些谁到达那里!你好皮埃尔,我已经成为你的博客很长一段时间了,这是我第一次介入我必须承认我很高兴并且非常惊讶你接近这样一个主题!事实上,在我看来,它很可能通过它的标点符号来识别一个作家的风格你没有提到福楼拜,但我认为它会找到合理的在你的文章的地方:如果你读三传说这是他的主题和风格的浓缩物,你会重新找到了著名的“逗号/分号,破折号和”之句感谢的结束,托马斯当标点符号变成语言:然后在想什么“部落Damasio的“支撑”和他的风的写作,由标点符号转录</p><p>我在考虑它!值得在本文中引用的一个例子!这真的是一场赌博,但我要说的莫里哀的守财奴对剩余部分的第二独白,我不知道卡尔霍恩先生,他认为使用机器学习,看看这些“模式实际上是否具有特征(从某种意义上说,他们会对作者的身份做出预测)</p><p>与机器学习(学习机)的提议完全同意,这将可能会给有趣的结果,只要在训练集(文本与他们的作家相关)是足够大的,我认为我们可以很容易区分的语言原创作品(甚至通过转换标志“ - >”)可以是作家的时期,但我对自己的作家一个问题,可能除了那些谁已经多产的这我们有足够的训练集(即使这是真的,有一个由作家的典型风格,这并不过于依赖的工作经验为主题美丽反正你好,经常被动的读者您博客,你的游戏令我着迷我的直觉通过选择2我也许很远短的好日子其实我宁愿这样回答的建议对我的Le Petit萨科:,, ...:嗨,d'你的第一个段落的括号后,让你加入我个人的“文学的伟大的科学popularizers”等雷蒙·格诺和比尔布莱森显示神殿它仍然需要多一点的二分法科学/封信是在法国被删除但是谢谢你的参与!我让我也加入M法布尔的科学文学列表... +马修Vidard尽管(对法国国米“中头方”和法国2“我在地球上行走”主持人)在一个或另一个标志的频率揭示特质“意味着”字加上引号,把一个省略号,使“离题”与破折号 - 和使用的话很少使用 - 单打我,即使当我用昵称签名时谢谢你这篇文章令人兴奋的不是关于Albert Cohen领主Belle的第二部摘录吗</p><p>我不认识任何东西(但我去看了答案,其他人一样我认为和希望)我只注意到在第一单中大量使用了令人钦佩的分号我会独自思考福楼拜,但它当然是!我爱它!谢谢你的这篇文章,即使我找不到答案,我也期待着答案!太好了!谢谢你,但我没有认出任何人......我还没读完所有内容,我后悔没有找到足够的内容!谢谢!这真的很有趣三分之一(第二),验证通过后,下面的链接,但很明显,尤其是你给的指数...至于其他人,我没有头绪但是我对作者有点不熟悉我希望比我更多的文学作品能找到解决方案;在任何情况下,演习是有趣的 - 我想,说不仅是风格,但也是作家的心理(在未来我会在我圈点我的句子的方式更加小心)卷你好,期待的经验,我想知道是否有可能增加一个颜色代码,根据来自绿色或红色渐变,根据所需的中断(红色为点,橙色的分号,等等)真诚,一个卡尔霍恩没有类似的东西,视觉上更引人注目的是确实是在他的票链接,点击“去看看中等” 2(通过把13位的字母在字母不扰流板):YN gvenqr QH手臂来提取,我会说长篇大论的鼻子,西拉诺情圣,爱德蒙罗斯坦德我</p><p>另外两个,不知道有趣的体验,这可能通过说甚至进一步推通过添加结果的可变长度,例如,每个标点符号之间的一个空间= 10个字母字符,2个空格= 20个字符10位= 100个字符等</p><p>因此样式将被更好地表示为考虑到之间的每一个标点符号强烈同意句或句子的序列的长度!直觉上,我认为长切口或逗号分隔的单词(好像吞了)不应该产生相同的结果</p><p> ()什么尼古拉斯Rougeux倾斜文学的重要的新经典文本只保留标点符号每个符号后面和设定画螺旋的http:// wwwc82net /工作/ ID = 347第一</p><p>真的很难!第二,我想我找到了,但我太急于看到答案了!三是容易与您的标题,我猜格诺但不是书(其实我也让自己有足够的时间去思考!)! ,! >这是我和我的冲动型veniam AUT悲和consequatur现状quidem属坐quia AUT 1种提取物由于很多 - (!); ; ;是极为罕见的,它必须是一个“文学”大多数人不知道如何使用分号为2和3有太多的问题???第二届太报价=美国文化中,“充电”的话来“暗示”的“其他”认为1和3是“好”的作家,因为逗号我不喜欢,我喜欢普鲁斯特席琳但我知道在盎格鲁 - 撒克逊按什么看遍文章双胞胎几个月前,当我们认识到,标点符号尤利西斯看起来像计算机代码,该绿野仙踪的乐谱:HTTP:// wwwvisualnewscom / 2016年1月25日/看 - 经典小说 - 可视化无话标点/伟大的想法,而且也为进一步研究远一点的可能性:提供取决于其他变量下面这些变量的机器学习算法,我们可以建立一个ML程序,给它一百斤的一半是学习样本,看看该程序涉及如何准确地猜测作者在另一半!几项研究处理这个问题非常有趣https://开头eventscccde /会议/ 2011 / Fahrplan /事件/ 4781enhtml https://开头eventscccde /会议/ 2011 / Fahrplan /附件/ 2019_28C3-authorshippdf @R “猜测” 或计算...:○ )</p><p>作者的计算将存在于百斤的两半,我相信</p><p>第二,节奏和与索引,会让我觉得西拉诺情圣鼻子的长篇大论来第一单,我建议Gracq也没有,除了大懒Destouches谁喜欢伪装成没有酒精矿工并坚持在她的三个小粪便从死亡上遏制疟疾,几乎无法辨认任何标点符号模式诗行的结尾是非常有用的,例如Marizibill这是非常有趣的,但是它不可能一步推的经验吗</p><p>确定为哪些标点的分布的直方图达到极限页这样的最小数(变化更敏感)就像一个乐器作为作家将由其“光谱”来表征逗号我建议研究支架的部落,Alain Damasio,其中标点符号有一个特别的地方!你好,可能是一个小参考部落风对达马西奥会受到欢迎在这本书中,风只用标点符号写的</p><p> ! ...感谢你所有的文章总是令人着迷,这个特别感兴趣的文学作品我是第一个摘录必须是福楼拜</p><p>我不能代替Salammbo酒店的第一句话,但可能感伤的教育或包法利夫人第二个是一个戏剧性的独白 - 喜剧,我会说我不认同的第三本小说,但我敢肯定,他是属于二十世纪目录我在数字人文学科实验室工作,我将这个程序提交给我们的计算机科学家谢谢!类似的文章读它两个月前在国家报,但与其他的例子... HTTP:// verneelpaiscom /凡尔纳/ 2016年2月24日/危象/ 1456301028_309591html有趣和克劳德·西蒙呢</p><p>我有Cyrano! Yesiiiiiii这个适度的完成,谢谢你的文章总是质量很好,清晰度很高!塞德里克1984年,吉恩·戴夫了,幽灵们熟悉的版本,一个题为传递性的书,是一个诗的“阅读”,州,阿内·玛丽·阿尔比奇,发表在1971年的法兰西信使在第一章中,标点符号是有完全从诗约尔格奥特纳谁想到,一个作家可以承认他的标点符号提出了一些打印只保留由保罗·策兰的一首诗,它因此吉恩·戴夫章题为分离: “Ortnian读数应用于状态读数”··············· - - - ·····亲爱的主席先生,我很欣赏你的博客,我与文学谁没有任何理解爱科学的好奇心经常阅读...你是真正在这个词的最佳意义上的伟大宣传我也是一名作家,J “我出版了好几本书,是编辑你的锻炼让我百感交集,我不能声称代表一般作家的说话,但我的一部分,我不建我的文字反映如何我写这句话,把标点,我想多快给......它不喜欢什么,我想写的工作,我想使情感,故事我心目中,这是溢价和写作是翻译,它的节奏,标点符号是那后果......这是怎么开始😉@chaillot你是对的,我分享我很惊讶的是,这项研究是不是由于研究人员制作的所有废话,他们怎能错过这项毫无疑问的重要研究</p><p>第一个提取物可能是巴尔扎克,第二个西拉诺鼻子的长篇大论,莫里哀的第三个</p><p>我太经典了吗</p><p>!</p><p>!稍你是接近第一(这是福楼拜),你只需要第二次,但你错了三个世纪的最后(雷蒙·格诺)......标点符号也是作者的自动预测有用关于这个问题的一项有趣的研究,这里提出:HTTP:// wwwaclweborg /选集/ N15-1010的复杂性还来自于碑文时间(它没有标点以同样的方式在十八到十九或二十世纪)不仅要考虑作者,还要考虑它适合的时间</p><p>限制“幸运”方面的时间限制是必要的,必须说,随机没有这些标记你的那这里说的是我的建议1福楼拜:包法利夫人出国2个莫泊桑乐Horla 3加缪我送你的图纸与字母两个女朋友骨料,我个人不觉得大小;通过利弊,我相信你的直觉是正确的,我是在独联体的研究员,我的标点符号抽动,包括使用几乎落入废弃分号和无节制使用3点我承认还练必须以我的文章给一个特定的节奏,因为一些认识我的风格形成了鲜明的报告未签名的研讨会,样式效果是禁止的</p><p>真的非常有趣和诗意!文本变成一种视觉语言莫迪亚诺1 2在地铁zazie的作者,3个R格诺博马你的仆人在他的业余时间一个作家,他认为不会对这个想法的难度,每一个作家都有他标点符号(并不会扔出去知道谁是谁)所以他对自己使用这件事非常挑剔不是一个点,而不是逗号没有被计算,但它使用最少的情感标点符号它保留它适用于番茄酱风格,隐藏的味道清淡(在...!</p><p>)东西对话ogmisée一种情绪的barbaque出生的选择的话,他们的句法组装,因此,类似的,标点符号例:“直到早上,直至死亡,超越了哭声和泪水,他看不没有一个手势一个字的孩子,他的孩子,他的牛仔裤,他的第一次,他唯一的全碎腹黑,看起来他,睡觉,看它,有时可以打开我的嘴,拖到他爸爸,你杀了我,“他发现了这一富有成效的紧缩阅读吉恩·罗德的第一本书,从这个不必要的自由然后他又开始了自己的第一个打字稿及所有燃煤HTTP:// misentrop2canalblogcom /你好非常有趣!非常感谢你的文学修养,也许你会感兴趣致力于令人振奋的“标点的艺术”的文学杂志2月号!我建议你看看这里......进行类似的探索,用于装饰目的! http:// wwwc82net / work /</p><p>id = 347 1巴尔扎克; 2乔伊斯</p><p> 3 Perec,或Levy,或Musso!据一些斯特凡纳·扎格达斯基在2011小册子席琳艺术上播出的节目是“非常有趣的文字,令人惊叹的漫画,”他重复约希望他们产生非常Celinian sensLa论文作家小丑,偏执妄想和是grotesqueCette问题是错误的组织,对真真假假,胡言乱语胡说八道由一个令人不安的aveuglementCet盲目性非常Celinian也启发是妄想,大伤元气,对人体有害,dangereuxIl有个名字: “antisémitismeLes‘小册子’LF Destouches不是‘药’,但criminelsNon‘Bagatelles倒联合国大屠杀’是不是‘的风格对待’,根据LFDestouches文学,这是垃圾,并实践它做好,应该是“好狗屎”(“拉屎不只是想要”)是一种唯美的地位</p><p>不,这是推动通过的审美abjectionNon激发一个项目的欲望时,二十世纪的历史不是“精神错乱”,文学是不是更“一个作家,一个天才的对抗他的时候,他不会与他合作的时候,他不相信他的时间补充说:“MZCe mZest显然不了解情况,并通过他的爱席琳说,逃脱了枪决,因为他出逃时,让失明”屎屁股” ......有证据表明,MLF Destouches是一个积极的合作者和热心纳粹军官(党卫队保安处或SD由海德里希领导),甚至叫几个作家,包括罗伯特·德斯诺斯,在营TerezinRobert Desnos谋杀的谋杀,他一直站在他的时间与示范的勇气和他vieL'antisémitisme支付,从民主西方的仇恨分不开的,是一个非常严肃的事情,唯一的可能是席琳:如果隐匿很少有自己的“作品”为我个人比较喜欢的语言广泛土质拉伯雷或克莱门特MarotCertains的想在原因一切代价恢复拖席琳小avouablesQu'ils,席琳有良好的管理爬顶上一个讲台上,....