programing

LaTeX 문서의 정확한 단어 수

nasanasas 2020. 11. 15. 11:22
반응형

LaTeX 문서의 정확한 단어 수


현재 LaTeX 문서에 대해 올바른 단어 수를 계산 하는 응용 프로그램이나 스크립트를 찾고 있습니다.

지금까지 저는 단일 파일에서만 작동하는 스크립트 만 만났지만 제가 원하는 것은 LaTeX 키워드를 안전하게 무시 하고 링크 된 파일을 순회 할 수있는 스크립트입니다 . 즉, 팔로우 \include\input링크를 통해 올바른 단어 수를 생성합니다. 전체 문서.

vim을 사용하면 현재 사용 ggVGg CTRL+G하지만 분명히 현재 파일의 개수를 표시하고 LaTeX 키워드를 무시하지 않습니다.

이 작업을 수행 할 수있는 스크립트 (또는 응용 프로그램)를 아는 사람이 있습니까?


나는 texcount. 웹 페이지 다운로드 Perl 스크립트 (및 수동)가 있습니다.

여기에는 문서에 tex포함 된 ( \input또는 \include) 파일 (참조 -inc), 매크로 지원 및 기타 많은 멋진 기능 이있는 파일이 포함 됩니다.

포함 된 파일을 따라갈 때 각 개별 파일에 대한 세부 정보와 총계를 얻을 수 있습니다. 예를 들어 다음은 내 12 페이지 문서의 총 출력입니다.

TOTAL COUNT
Files: 20
Words in text: 4188
Words in headers: 26
Words in float captions: 404
Number of headers: 12
Number of floats: 7
Number of math inlines: 85
Number of math displayed: 19

총계에만 관심이 있다면 -total인수를 사용하십시오 .


나는 icio의 의견에 가서의 출력 파이프하여 PDF로 자체의 단어 수를 한 pdftotext로를 wc:

pdftotext file.pdf - | wc - w 

latex file.tex
dvips -o - file.dvi | ps2ascii | wc -w

상당히 정확한 단어 수를 제공해야합니다.


Texmaker 인터페이스에서 PDF 미리보기를 마우스 오른쪽 버튼으로 클릭하여 단어 수를 확인할 수 있습니다.

여기에 이미지 설명 입력

여기에 이미지 설명 입력


@aioobe에 추가하려면

pdflatex를 사용하는 경우

pdftops file.pdf
ps2ascii file.ps|wc -w

이 수를 1599 단어 문서 (Word에 따라)의 Microsoft Word 수와 비교했습니다. pdftotext1700 개 이상의 단어로 텍스트를 생성했습니다. texcount참고 문헌을 포함하지 않고 1088 단어를 생성했습니다. ps2ascii1603 단어를 반환했습니다. Word에서보다 4 더 많습니다.

나는 그것이 꽤 좋은 계산이라고 말한다. 그래도 4 단어 차이가 어디인지 모르겠습니다. :)


다음 VIM 스크립트를 사용합니다.

function! WC()
    let filename = expand("%")
    let cmd = "detex " . filename . " | wc -w | perl -pe 'chomp; s/ +//;'"
    let result = system(cmd)
    echo result . " words"
endfunction

… 그러나 링크를 따르지 않습니다. 이것은 기본적으로 모든 연결된 파일을 가져 오기 위해 TeX 파일을 구문 분석 하는 것을 수반 합니다.

다른 답변에 비해 장점은 단어 수를 계산하기 위해 출력 파일 (PDF 또는 PS)을 생성 할 필요가 없기 때문에 잠재적으로 (사용에 따라) 훨씬 더 효율적이라는 것입니다.

icio의 의견은 이론적으로 정확하지만 위의 방법이 단어 수에 대해 매우 정확한 추정치를 제공한다는 것을 발견했습니다. 대부분의 텍스트에서 많은 과제에 사용되는 5 % 여백 이내입니다.


매우 기본적인 기사 클래스 문서의 경우 정규식이 단어를 찾기 위해 일치하는 수를 살펴 봅니다. 저는 Sublime Text를 사용하므로이 방법은 다른 편집기에서는 작동하지 않을 수 있지만 Ctrl+F( Command+FMac에서는)를 누른 다음 정규식을 활성화 한 상태에서 다음을 검색합니다.

(^|\s+|"|((h|f|te){)|\()\w+

\usepackage따옴표와 괄호를 포함하여 대부분의 기본 방정식 및 선언 뿐만 아니라 부동 환경을 선언하는 텍스트 또는 그림의 캡션을 무시해야합니다 . 또한 각주 및 \emphasized 텍스트를 계산하고 \hyperref링크를 한 단어로 계산 합니다. 완벽하지는 않지만 일반적으로 수십 단어 정도로 정확합니다. 당신은 당신을 위해 작동하도록 그것을 다듬을 수 있지만 LaTeX 소스 코드는 일반 언어가 아니기 때문에 스크립트가 더 나은 솔루션 일 것입니다. 여기에 이걸 던질 줄 알았는데


Overleaf에는 단어 수 기능이 있습니다.

오버 리프 v2 :

여기에 이미지 설명 입력

여기에 이미지 설명 입력

오버 리프 v1 :

여기에 이미지 설명 입력

여기에 이미지 설명 입력

참고 URL : https://stackoverflow.com/questions/2974954/correct-word-count-of-a-latex-document

반응형