اولین بار است که به اینجا می‌آیید؟ راهنمای سایت را بخوانید!
0 رای
2.8k بازدید

با سلام

بنده می خوام بدونم که تو PDF حاصل از حروف چینی در لاتک، با چه دستوری میتونم از تعداد کل کلمات و حروف استفاده شده در متن مطلع شوم. به عنوان مثال، یک فایل ضمیمه شده است.

با تشکر

2 پاسخ

+2 رای

اگر به لینکی که آقای مسهر باقری داده‌اند نگاه کنید می‌بینید که برای شمارش تعداد کلمات باید از یک ابزار خارجی استفاده کنید.

هر چند اگر کمی فکر کنید متوجه می‌شوید که در متن کلمات بصورت زیر از هم جدا می‌شوند:

  • حرف و فاصله
  • حرف و کاما
  • حرف و نقطه

بنابراین شمارش تعداد کلمات بسیار راحت هست تنها باید از دستورات بدوی \XeTeXcharclass و \XeTeXinterchartoks استفاده کنید.

\documentclass{article}
\usepackage{color}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyComma
\XeTeXcharclass`\،\MyComma
\XeTeXcharclass`\,\MyComma
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \MyComma = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\PrintWordCount}
\newcommand*{\PrintWordCount}{\raise.8\baselineskip\llap{\tiny\global\advance\WordCount\@ne\textcolor{red}{\the\WordCount}}}
\makeatother
\begin{document}
\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}

enter image description here

enter image description here

همانطور که در خروجی می‌بینید این نوشتار ۱۳۳۵ کلمه دارد.

توضیح کد

الفبای پارسی و انگلیسی را داخل یک کلاس و کاما را هم داخل کلاسی دیگر قرار می‌دهیم. هرگاه بعد از حرفی فاصله، نقطه و یا کاما وجود داشت یک شماره به شمارنده کلمات می‌افزاییم و شماره کلمه را در بالای کلمه چاپ می‌کنیم.

مثل همیشه بسیار زیبا و جذاب


به نظرم اگر حوصله دارید و این را در قالب یک بسته ارائه دهید خیلی کاربردی خواهد بود.
برای مثال، در چکیده پایان‌نامه دانشجویان و یا مقالات تعداد کلمات از حدی معینی نباید تجاوز نماید. با تعریف دستورات فوق در قالب یک محیط کاربر می‌تواند از تعداد صحیح آن‌ها اطمینان یابد.
توسط (4.4k امتیاز)
این کد خیلی ساده‌ای. برای بسته نه ولی همین نمونه رو آقای امین‌طوسی و یا سایر دوستان می‌تونند به نمونه‌های موجود در دی‌وی‌دی پارسی‌لاتک اضافه کنند.
توسط (25.0k امتیاز)
شاید برای شما ساده باشد لکن به نظرم برای خیلی‌ها کاربردی خواهد بود.
و صد البته از بسته emptypage که قطعا ساده‌تر نیست؟!
توسط (4.4k امتیاز)
+1 رای

در مقایسه با پاسخ قبلی این پاسخ کامل‌تر است. تفاوت‌های این پاسخ با پاسخ قبلی بصورت زیر است:

\MyComma به \MyPunctuations تغییر کرده.

تعداد بیشتری علامت‌های نگارشی که در آخر حرف ممکن است قرار بگیرد در نظر گرفته شده است و بنابراین تشخیص کلمه هوشمندتر شده است.

به جای چاپ شماره کلمات در بالای هر کلمه که ممکن است خیلی شلوغ شود، دستور \PrintWordCount تنها تعداد کل کلمات در تمام نوشتار را چاپ می‌کند و برای چاپ صحیح تعداد کلمات احتیاج به دوبار اجرا است. اطلاعات مربوط به تعداد کلمات هر بار در انتهای نوشتار به فایل .aux نوشته می‌شود.

\documentclass{article}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyPunctuations
\XeTeXcharclass`\{\MyPunctuations
\XeTeXcharclass`\}\MyPunctuations
\XeTeXcharclass`\[\MyPunctuations
\XeTeXcharclass`\]\MyPunctuations
\XeTeXcharclass`\(\MyPunctuations
\XeTeXcharclass`\)\MyPunctuations
\XeTeXcharclass`\`\MyPunctuations
\XeTeXcharclass`\'\MyPunctuations
\XeTeXcharclass`\!\MyPunctuations
\XeTeXcharclass`\:\MyPunctuations
\XeTeXcharclass`\;\MyPunctuations
\XeTeXcharclass`\?\MyPunctuations
\XeTeXcharclass`\؟\MyPunctuations
\XeTeXcharclass`\«\MyPunctuations
\XeTeXcharclass`\»\MyPunctuations
\XeTeXcharclass`\،\MyPunctuations
\XeTeXcharclass`\,\MyPunctuations
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \MyPunctuations = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\AddTo@WordCount}
\newcommand*{\AddTo@WordCount}{\global\advance\WordCount\@ne}
\newcommand*{\PrintWordCount}{\textbf{??}}
\newcommand*{\@PrintWordCount}[1]{\gdef\PrintWordCount{#1}}
\AtEndDocument{%
\protected@write\@auxout{}{\string\@PrintWordCount{\the\WordCount}}}
\makeatother
\begin{document}
\fbox{%
این نوشتار دارای
\PrintWordCount{}
کلمه
می‌باشد.%
}

\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}
خیلی عالی. به عنوان پیشنهاد برای جلوگیری از شلوغ شدن هنگام شماره‌گذاری بالای هر کلمه می‌توان این کار را برای هر ۲۰ یا ۳۰ کلمه انجام داد و یا حتی آخرین کلمه هر پاراگراف.
توسط (3.7k امتیاز)
خیلی ممنون هستم از پاسختون. بالاخره متوجه شدم چجوری باید از این کد استفاده کنم! خیلی ممنونم. ولی خیلی کُد پیچیده ای بود! برای من که مبتری هستم در لاتک فهمش واقعا مشکله! ولی کار بنده راه افتاد. بسیار بسیار سپاسگذارم از لطفتون
ویرایش شده توسط
توسط (5 امتیاز)
من پیچیدگی نمی‌بینم. در پاسخ قبلی که شماره هر کلمه با رنگ قرمز بالای هر کلمه چاپ میشه. در این پاسخ هم \PrintWordCount تعداد کل کلمات رو در نوشتار به شما نشون می‌دهد.
توسط (25.0k امتیاز)
سلام برای من اجرا نمیشه و ارور میده!
توسط (45 امتیاز)
پرسیدن سوال
وب‌سایت پرسش و پاسخ پارسی‌لاتک جایی برای پرسش و پاسخ درباره سیستم حروف‌چینی لاتک و بسته زی‌پرشین است. در اینجا می‌توانید سوال‌های خود را بپرسید و به سوال‌های دیگران پاسخ دهید.

7.1k پرسش

6.6k پاسخ

23.5k نظر

7.1k کاربر

محبوب‌ترین برچسب‌ها

رفع خطا جدول xepersian مراجع ریاضی‌نویسی شکل bidi فونت فهرست مطالب شماره‌گذاری منابع پانویس بیب‌تک tikz parsilatex تک‌لایو بیمر اسلاید زی‌پرشین پاورقی bibtex سربرگ نماد رسم شکل فرمول‌نویسی ارجاع‌دهی biditexmaker هدر ویرایشگر قالب beamer واژه‌نامه اندازه فونت texstudio عنوان فصل ماتریس اعمال نشدن تغییرات در پی‌دی‌اف رسم جدول شماره صفحه bidipresentation حاشیه رنگ عنوان شکل اسلاید فارسی محیط قضیه گراف مکان شکل tikzpicture enumerate حروف‌چینی کد شماره فصل tabriz_thesis نمایه align زیرنویس شکل کادر itemize فهرست اشکال الگوریتم عدم اجرا listings نیم‌فاصله متن لاتین و فارسی بسته فاصله بین خطوط قالب پایان‌نامه فرمول نصب تک‌لایو فارسی‌تک hyperref شماره فرمول glossaries کپشن نمودار خروجی لاتک حروف‌چینی چندستونی فونت فارسی و انگلیسی ماکرونویسی biditools شماره پاورقی پیوست‌ سوال امتحانی فاصله‌گذاری فرمول چندضابطه‌ای extrafootnotefeatures subfigure biditufte-book header texmaker pdf خطا tex longtable تصویر شمارنده زیرنویس texlive2015 دیاگرام رسم نمودار شماره‌گذاری صفحات پایان نامه فهرست جداول میک‌تک texlive2016 تنظیم جدول آکولاد شعر kashida بولد تورفتگی texworks caption اندیس اعداد فارسی lollipop iust-thesis multicol فصل‌نویسی سوال چهارگزینه‌ای فاصله عمودی pgfplots xindy چپ‌چینی اوبونتو میکروسافت ورد قاب geometry xelatex texlive fancyhdr وسط‌چینی تک لایو 2015 tcolorbox عنوان بخش شماره گذاری به‌روزرسانی بسته aimc46 صفر توخالی فرمول طولانی بیرون‌زدگی کاما پوستر فاصله سطرها نوشتافت شکست خط tex-programming فونت اعداد قرآن tabriz-thesis
...