#!/bin/bash#@filename checkAddWord.sh#@author Zjmainstay#@website http://www.zjmainstay.cn#@year 2015#allword.txt 存放总词库(每行一个)#newword.txt 存放新增词(每行一个)#newword.add.txt 在cygwin中执行sh checkAddWord.sh后,可新增词存入此文件#唯一化总库cat allword.txt | sort | uniq | sed -e "s/^\s*\xEF\xBB\xBF//g" | sed -e "{N;s/\r//g}" > allword.tmp.txtmv allword.tmp.txt allword.txt#唯一化新词库cat newword.txt | sort | uniq | sed -e "s/^\s*\xEF\xBB\xBF//g" | sed -e "{N;s/\r//g}" > newword.tmp.txtmv newword.tmp.txt newword.txt#得到已使用词库cat allword.txt newword.txt | sed -e "{N;s/\r//g}" | sort | uniq -c | grep "^\s*[2-9] " | sed -e "s/^\s*[2-9]\s//g" | sed -e "{N;s/\r//g}" | sed -e "s/^\s*\xEF\xBB\xBF//g" > usedword.txt#得到新词库cat newword.txt usedword.txt | sed -e "{N;s/\r//g}" | sort | uniq -c | grep "^\s*1 " | sed -e "s/^\s*1\s//g" | sed -e "s/^\s*\xEF\xBB\xBF//g" | sed -e "{N;s/\n/\r\n/g}" > newword.add.txt#删除已使用词库rm -rf usedword.txtecho "如下关键词可新增:"cat newword.add.txt
未经同意禁止转载!
转载请附带本文原文地址:如何使用shell从一个文件中取出不在另一个文件中的内容,首发自 Zjmainstay学习笔记




