2021年普通高等学校招生全国统一考试语文知和理解。一句话,人的阅读不可替代。需要补充的是,当考查单篇文本的文本特征(例如计算一篇文档中所有单字的出现频率),或者分析注意事项:1.答卷前,考生务必将自己的姓名,准考证号填写在答题卡上。其内部结构(例如提取一部小说中所有人物的对话网络)时,数据量也会增长到个人无法处理的程度。所2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,以,上述对文本集合所做的讨论在单篇文本层面也是成立的。用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上,写在本试卷上无效。一个普遍存在的对数字人文的评判依据,是看数字人文能不能更好地回答传统人文学者所关心的问3.考试结束后,将本试卷和答题卡一并交回。题。严格说来,只有当数据量或者数据精度超出了个人阅读理解的能力范围时,才有理由借助计算机来对一、现代文阅读(36分)文本或者文本集合的特征予以量化描述,进而提供给人去进行深入解读。数字人文不仅仅是新的手段和方(一)论述类文本阅读(本题共3小题,9分)法,更重要的是,它赋予我们提出新问题的能力。我们现在可以问,五千年来全人类使用最频繁的词是什阅读下面的文字,完成下面小题。么。透过这类问题,可以获得观察超长历史时段文化现象的新视角。对于人文研究来说,计算方法以往只是作为辅助手段而存在的,而今天已取得了不可替代的地位。一(摘编自王军《从人文计算到可视化——数字人文的发展脉络梳理》)种新的人文研究形态应运而生,这就是“数字人文”。学者莫莱蒂曾设想一种建立在全部文学文本之上的1.下列关于原文内容的理解和分析,不正确的一项是()世界文学研究,人们必须借助计算机对大规模的文学文本集合进行采样、统计、图绘,分类,描述文学史A.在数字人文的概念提出之前,计算方法已被引入人文领域,在研究中发挥作用。的总体特征,然后再做文学评论式的解读。为此,他提出了与“细读”相对的“远读“作为方法论。弄清B.要实现莫莱蒂设想的世界文学研究,首先应进行大规模的文学文本集合的数据化。计算机的远读与人的细读之间的差别,不仅能使我们清晰地界定计算方法在人文研究中的作用,而且可以C.选择远读还是细读的方法,取决于阅读的对象是大规模的文本集合还是单篇文本。帮助我们重新确立人的阅读的价值。D.数字人文不仅为文本处理提供了新的手段和方法,而且为人文研究提供了新视角。2.下列对原文论证的相关分析,不正确的一项是()计算机是为科学计算而创造出来的,擅长的是“计数”,而非理解。要处理自然语言文本,计算机必A.文章区分“计数”与“理解”,是为了论证计算机不能处理某些特定类型的文本。须先将文本置换成便于计数的词汇集合,或者用更复杂的代数模型和概率模型来表示文本,这一过程被称B.文章转述数字人文学者米歇尔本人的说法,有助于论证应该更全面地看待远读。为“数据化”。数据化之后所得到的文本替代物(集合、向量、概率)虽然损失了原始文本的丰富语义,C.文章第四段讨论单篇文本层面的问题,对前文补充论证,使得论证更加周密。但终究是可以计算的了。不过,尽管计算机能处理海量的语料,执行复杂的统计、分类、查询等任务,但D.文章同时肯定计算机远读和人的细读的作用,有助于避免人们对远读的误解。它并不能理解文本的内容。3.根据原文内容,下列说法正确的一项是()A.人文研究的主体,在数字人文中实现了从具体的学者个人向计算机的转变。远读是数字人文的基石。大规模的文本集合上的远读,基本上可以归为两类:一是对文本集合整体统B.远读不是要深化对文本内容的理解,而是要发掘文本集合的共同形式特征。计特征的描述,一是对文本集合内在结构特征的揭示。例如,数字人文学者米歇尔等人对数百万册数字化C.数字人文的价值,在于将历史上未被注意和阅读的文本都进行数据化并做研究。图书进行多种词汇和词频统计,以分析英语世界的语言演变,这属于前者;莫莱蒂用地图、树结构来分别D.和人的细读相比,远读的理念和做法体现出大数据时代文理融合的跨学科取向。展示文学作品的地理特征...