Word中删除重复文字及段落

风清扬斈 4年前 (2015-10-23) 信息科技 2229 0

 

 

 


Word中删除重复文字及段落
关于word怎么帮重复的句子删除啊,快速的请教大家一个问题,关于word怎么帮重复的句子删除啊,快速的,不是查找,我有个文件,好多重复的句子,请大家帮个忙
选中要替换的内容,先进行排序(表格/排序)选择要替换的内容,按下Ctrl+H组合键,打开替换对话框,勾选使用通配符在查找内容框中输入(*^13){2,},在替换为框中输入

  用替换。
查找内容就是你这个重复句子,替换为...里面不输内容。
不过替换过的时候这个句子所有的都没有了,需要把应该有的地方补充上。
WORD批量删除重复段落
首先:把每个段落标记替换为二个(查找内容“^p”,替换为“^p^p”)
如果是连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13[!^13]@^13){2,}
替换为:1
全部替换
重复一下,看看有没有替换干净(一个段落一般不会重复255次以上吧,呵呵),不行就再来几次,直到替换处数为0。
此命令效率非常之高!成千上万页内容可瞬间完成!
如果是不连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13[!^13]@^13)(*)1
替换为:^1312
全部替换
重复几次,只到替换处数为0。
此命令效率非常之高!成千上万页内容可瞬间完成!
Word批量清除重复段落
统一规范的排版格式很重要,是处理的前提条件,否则,要准确查找并处理重复的内容很难。
如果是连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(?{1,}^13)1
替换为:1
全部替换
重复几次,直到替换处数为0。

如果是不连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:^13(?{1,}^13)(*)1
替换为:^1312
全部替换
重复几次,只到替换处数为0。
注意事项:
1、最好先清除多余空行;
2、替换之前,一定把光标放在文章开始处(Ctrl+Home),因为WORD默认是在光标开始处查找。或者全选
文档(Ctrl+A)。
清除空行可以用替换命令:把“^13^13”替换为“13”(把每两个段落标记替换为一个),来几次就可以了!
这个命令用少量的文字测试的时候没问题,但长达几百页,速度还是太慢了。
word表格中如何删除文章中重复段落
问:我复制一篇小说,可发现其中有好些章节或者是段落是重复的,如何利用word文档快速搜索重复的段落,之后删除呢?
答:粘贴到Excel处理,很容易:
1、Word:Ctrl+A——Ctrl+X——Excel:Ctrl+V(数据默认在A列)
2、在B1输入=IF(COUNTIF(A$1:A1,A1)>1,"重复","")回车并向下填充;
3、选B列——菜单栏——数据——筛选——自动筛选——点B1倒▲下拉:选(空白);
4、选A列数据——Ctrl+C——Word:菜单栏——编辑——选择性粘贴——无格式文本。或:Word:Ctrl+V(连表格一起过去);
5、选表格——菜单栏——表格——转换——表格转换成文本——确定。
Word指删除重复段落(改进方式)
有时候,需要整理的文档有大量重复的段落,如何批量清除呢?
[准备工作]
1、把每个段落标记替换为二个(查找内容“^p”,替换为“^p^p”)
2、把光标放在文章开始处(Ctrl+Home),因为WORD默认是从光标开始处查找。或者全选文档(Ctrl+A)。
[正式开始]
如果是连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13[!^13]@^13){2,}
替换为:1
全部替换
重复一下,看看有没有替换干净(一个段落一般不会重复255次以上吧,呵呵),不行就再来几次,直到
替换处数为0。
此命令效率非常之高!成千上万页内容可瞬间完成!
如果是不连续的重复段落:
点击:编辑-替换
勾选通配符
查找内容:(^13[!^13]@^13)(*)1
替换为:^1312
全部替换
重复几次,只到替换处数为0。
此命令对数百页文档可能需时较长,因为要执行循环比较,请耐心等候!
这段代码的意思:
查找内容:(^13[!^13]@^13){2,}
替换为:1
^13表示段落标记,[!]表示“非”,[!^13]表示段落标记之外的任意单个字符;@表示一个以上的前一字符或表达式,它跟[!^13]一起表示一个以上的段落标记之外的字符,^13[!^13]@^13也就是包含前后段落标记的、有任意个字符的、非空的段落;用圆括号将其括起来(^13[!^13]@^13),意思是将这一部分加以标识,这是我们标识的第一部分,下面替换为框中的1代表的就是它!
{n,}代表至少 n 个前一字符或表达式,那么{2,}当然就表示2个以上这样的段落(括号括起来的部分),注意,应该是完全相同的段落!注意这里的{2,}不可以用@来替代,如果用@的话,因为它也包括“一个”的情况,那么在执行的时候,所有的不重复的段落也会被它自己替换一遍,执行效率要大打折扣!
题外话:正则表达式里要是有一个代码表示“两个或两个以上”的意思,该多好啊!
另外,这段代码里,[!^13]这个思想我自己觉得用的比较好!电脑也好判断啊,呵呵!
删除word和txt文件中重复的段落
在word、txt等文件中,经常会出现重复的段落,特别是下载的文件中,有时重复的广告段落比正文还多,如果文稿较短,手动删除即可,但几百页、上千页中有大量重复段落,就不好办了。我在网上搜索了一下,发现有不少删除办法,但我认为自己的方法是最好的,是利用EXECL中数据筛选,去除重复的记录方法实现的。下面给大家共享一下。
1、打开MS OFFICE软件中的EXCEL表格软件。
2、点击“文件”—“打开”,这时会出现一个文件选择窗口。
3、点击“文件类型”选择条,选择“所有文件(*.*)。
4、在文件选择窗口里选择你需要删除重复段落的WORD或TXT文件后点击“打开”。
5、出现“文本导入向导”,选择“分隔符号”点击“下一步”,选择“TAB键”,点击“完成”。
6、文本已经导入EXECL中。
7、选择表格中第一列,点击菜单“数据”——“筛选”——“高级筛选”,列表区域是你所有数据,例如A1到A1000,则列表区域为$A$1:$A$1000,选择“将筛选结果复制到其他区域”,可选择$ M$1:$M$1000,勾选“选择不重复的记录”,然后点击“确定”。
8、通过以上步骤,不重复的段落全部复制到$ M$1:$M$1000中,这时可将原数据,即A列删除,剩下的就是不重复的段落。
9、将文件另存为TXT文件,任务完成。
需要说明的是,有时有用的重复段落也会被删除,另外,有时候需要对原文件进行一下才能准确实现。

 

"

相关推荐

  • 网友评论

    • (*)

    最新评论