日记大全

日记大全 > 句子大全

信息论计算动物语言的规模

句子大全 2023-12-30 06:47:01
相关推荐

新的研究使用数学技术来估计鸟类和鲸鱼等动物在发声时使用了多少单词。运用信息论这门学科,可以解释动物语言的结构和复杂性,尽管它还不能告诉我们动物在传达什么。

自从20世纪40年代信息论思想出现以来,人类语言就被解构成了一些零碎的东西。科学家可以利用我们物种庞大的印刷文本作为一个数据库,把单词和它们的组合看作一个可以分析的信号。符号的频率和重复是衡量人类语言信息内容的一种手段。英语中的符号是26个字母,加上一个空格字符。然而,对于动物的交流方式来说,弄清楚这些符号可能有点棘手,而且研究人员也没有他们可以挖掘的庞大的动物语言库的好处。

我很想能翻译海豚的话,雷金纳德·史密斯(ReginaldSmith)说。由于没有可供点击和口哨使用的翻译应用程序,他利用信息论来获得洞察力。史密斯说:有些动物使用有意义的符号或声音的组合,所以我尽量避免使用这些词。

相反,他用了N克这个词。作为公民科学家联盟的独立研究人员,史密斯以前曾使用统计方法来探索复杂的语言系统,比如已经灭绝的东非语言Meroitic。有了人类语言,研究单词发生的频率,以及单词中的符号是如何组合成更长的单词,可以告诉我们信息被传输了多少,这是一种可以用比特来衡量的数量,也就是计算机上的1和0信息存储的相同单位。

同样的原则也适用于动物交流,这就是史密斯在一项新的研究中所做的工作,这项研究发布在科学预印服务器上。阿西夫。单词中字母的方式取决于它前面的字母-一种被称为序列中符号的条件熵的属性-可以通过一些复杂的计算来估计语言中单词的数量,或N-克。史密斯利用先前研究的数据,记录了宽吻海豚、座头鲸和四种鸟类的口哨声、叫声和歌声,包括知更鸟和欧洲雏鸟。

海豚有27个口哨,他们经常使用,虽然有125个不同的口哨使用的整体,史密斯说。他们以一种统一、重复的方式使用这些口哨,而鸟类则倾向于更自由地使用其曲目中的所有歌曲。

从动物记录开始,Smith首先确定单个符号传递了多少信息,以及随着第二、第三或第四个符号或字母的添加而发生的变化。例如,在英语中,在第一个字母后面添加第二个字母可以传递4.14位的信息,而第三个字母有3.56位,第四个是3.30位,它们被称为第一、第二和第三阶熵,并描述符号组合在传递信息的同时,不会变得多余的时间。他研究的所有鸟类歌曲似乎都局限于第一阶,显示出较低的复杂程度。

然后,Smith从对语言复杂性的估计推断出它的总词汇量。例如,海豚的词汇量大约有36个单词,而鲸鱼的数字约为23个;据估计,明星歌曲曲目约为119至202首歌曲。当原始数据的数量减少时,尺寸估计的精度就会下降;在熵的每一个增加的顺序中,需要更多的语言样本来创建一个很好的一、二、三字母序列或N-克的估计值。例如对于鲸鱼来说,没有足够的数据超过二阶熵,所以Smith无法确定可能会有多少更长的序列。他还怀疑被圈养的动物,比如海洋世界的海豚,他使用的哨声数据可能没有那么复杂,但这需要更多的样本和比较研究来验证。

超越仅仅测量动物语言的结构和复杂性将是一个合乎逻辑的下一步,史密斯说,他将留给动物研究人员。他说,从一种模式中提取出一首歌或一首歌,就像从句子中摘取一个词一样具有启发性:我们需要更多的研究,来研究二阶或三级复杂性对动物交流的价值。

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新