به دلیل قطعی اینترنت و نبود دسترسی به ایمیل‌های خارجی، می‌توانید بدون نیاز به تایید ایمیل، ثبت‌نام کنید و پرسش‌های خود را بپرسید.

اولین بار است که به اینجا می‌آیید؟ راهنمای سایت را بخوانید!
0 رای
3.6k بازدید

با سلام

بنده می خوام بدونم که تو PDF حاصل از حروف چینی در لاتک، با چه دستوری میتونم از تعداد کل کلمات و حروف استفاده شده در متن مطلع شوم. به عنوان مثال، یک فایل ضمیمه شده است.

با تشکر

در نسخه‌های امروزی بسته‌ها باید از این راه‌حل استفاده بشه.

توسط (6.9k امتیاز)

2 پاسخ

+2 رای

اگر به لینکی که آقای مسهر باقری داده‌اند نگاه کنید می‌بینید که برای شمارش تعداد کلمات باید از یک ابزار خارجی استفاده کنید.

هر چند اگر کمی فکر کنید متوجه می‌شوید که در متن کلمات بصورت زیر از هم جدا می‌شوند:

  • حرف و فاصله
  • حرف و کاما
  • حرف و نقطه

بنابراین شمارش تعداد کلمات بسیار راحت هست تنها باید از دستورات بدوی \XeTeXcharclass و \XeTeXinterchartoks استفاده کنید.

\documentclass{article}
\usepackage{color}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyComma
\XeTeXcharclass`\،\MyComma
\XeTeXcharclass`\,\MyComma
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \MyComma = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\PrintWordCount}
\newcommand*{\PrintWordCount}{\raise.8\baselineskip\llap{\tiny\global\advance\WordCount\@ne\textcolor{red}{\the\WordCount}}}
\makeatother
\begin{document}
\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}

enter image description here

enter image description here

همانطور که در خروجی می‌بینید این نوشتار ۱۳۳۵ کلمه دارد.

توضیح کد

الفبای پارسی و انگلیسی را داخل یک کلاس و کاما را هم داخل کلاسی دیگر قرار می‌دهیم. هرگاه بعد از حرفی فاصله، نقطه و یا کاما وجود داشت یک شماره به شمارنده کلمات می‌افزاییم و شماره کلمه را در بالای کلمه چاپ می‌کنیم.

مثل همیشه بسیار زیبا و جذاب


به نظرم اگر حوصله دارید و این را در قالب یک بسته ارائه دهید خیلی کاربردی خواهد بود.
برای مثال، در چکیده پایان‌نامه دانشجویان و یا مقالات تعداد کلمات از حدی معینی نباید تجاوز نماید. با تعریف دستورات فوق در قالب یک محیط کاربر می‌تواند از تعداد صحیح آن‌ها اطمینان یابد.
توسط (4.4k امتیاز)
این کد خیلی ساده‌ای. برای بسته نه ولی همین نمونه رو آقای امین‌طوسی و یا سایر دوستان می‌تونند به نمونه‌های موجود در دی‌وی‌دی پارسی‌لاتک اضافه کنند.
توسط (26.4k امتیاز)
شاید برای شما ساده باشد لکن به نظرم برای خیلی‌ها کاربردی خواهد بود.
و صد البته از بسته emptypage که قطعا ساده‌تر نیست؟!
توسط (4.4k امتیاز)
+1 رای

در مقایسه با پاسخ قبلی این پاسخ کامل‌تر است. تفاوت‌های این پاسخ با پاسخ قبلی بصورت زیر است:

\MyComma به \MyPunctuations تغییر کرده.

تعداد بیشتری علامت‌های نگارشی که در آخر حرف ممکن است قرار بگیرد در نظر گرفته شده است و بنابراین تشخیص کلمه هوشمندتر شده است.

به جای چاپ شماره کلمات در بالای هر کلمه که ممکن است خیلی شلوغ شود، دستور \PrintWordCount تنها تعداد کل کلمات در تمام نوشتار را چاپ می‌کند و برای چاپ صحیح تعداد کلمات احتیاج به دوبار اجرا است. اطلاعات مربوط به تعداد کلمات هر بار در انتهای نوشتار به فایل .aux نوشته می‌شود.

\documentclass{article}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyPunctuations
\XeTeXcharclass`\{\MyPunctuations
\XeTeXcharclass`\}\MyPunctuations
\XeTeXcharclass`\[\MyPunctuations
\XeTeXcharclass`\]\MyPunctuations
\XeTeXcharclass`\(\MyPunctuations
\XeTeXcharclass`\)\MyPunctuations
\XeTeXcharclass`\`\MyPunctuations
\XeTeXcharclass`\'\MyPunctuations
\XeTeXcharclass`\!\MyPunctuations
\XeTeXcharclass`\:\MyPunctuations
\XeTeXcharclass`\;\MyPunctuations
\XeTeXcharclass`\?\MyPunctuations
\XeTeXcharclass`\؟\MyPunctuations
\XeTeXcharclass`\«\MyPunctuations
\XeTeXcharclass`\»\MyPunctuations
\XeTeXcharclass`\،\MyPunctuations
\XeTeXcharclass`\,\MyPunctuations
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \MyPunctuations = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\AddTo@WordCount}
\newcommand*{\AddTo@WordCount}{\global\advance\WordCount\@ne}
\newcommand*{\PrintWordCount}{\textbf{??}}
\newcommand*{\@PrintWordCount}[1]{\gdef\PrintWordCount{#1}}
\AtEndDocument{%
\protected@write\@auxout{}{\string\@PrintWordCount{\the\WordCount}}}
\makeatother
\begin{document}
\fbox{%
این نوشتار دارای
\PrintWordCount{}
کلمه
می‌باشد.%
}

\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}
خیلی عالی. به عنوان پیشنهاد برای جلوگیری از شلوغ شدن هنگام شماره‌گذاری بالای هر کلمه می‌توان این کار را برای هر ۲۰ یا ۳۰ کلمه انجام داد و یا حتی آخرین کلمه هر پاراگراف.
توسط (3.7k امتیاز)
خیلی ممنون هستم از پاسختون. بالاخره متوجه شدم چجوری باید از این کد استفاده کنم! خیلی ممنونم. ولی خیلی کُد پیچیده ای بود! برای من که مبتری هستم در لاتک فهمش واقعا مشکله! ولی کار بنده راه افتاد. بسیار بسیار سپاسگذارم از لطفتون
ویرایش شده توسط
توسط (5 امتیاز)
من پیچیدگی نمی‌بینم. در پاسخ قبلی که شماره هر کلمه با رنگ قرمز بالای هر کلمه چاپ میشه. در این پاسخ هم \PrintWordCount تعداد کل کلمات رو در نوشتار به شما نشون می‌دهد.
توسط (26.4k امتیاز)
سلام برای من اجرا نمیشه و ارور میده!
توسط (45 امتیاز)
پرسیدن سوال
سایت پرسش و پاسخ پارسی‌لاتک جایی برای پرسش و پاسخ درباره سیستم حروف‌چینی لاتک و بسته زی‌پرشین است. در اینجا می‌توانید سوال‌های خود را بپرسید و به سوال‌های دیگران پاسخ دهید.

7.2k پرسش

6.6k پاسخ

23.7k نظر

11.7k کاربر

basket cart icon

محصولات مرتبط با LaTeX

در فروشگاه پارسی‌لاتک


basket cart icon

حمایت مالی از پارسی‌لاتک

برای تامین هزینه‌های نگه‌داری و به‌روزرسانی

محبوب‌ترین برچسب‌ها

رفع خطا جدول xepersian مراجع ریاضی‌نویسی bidi شکل فونت فهرست مطالب شماره‌گذاری منابع پانویس tikz parsilatex بیب‌تک تک‌لایو بیمر اسلاید زی‌پرشین پاورقی سربرگ bibtex نماد رسم شکل فرمول‌نویسی هدر ارجاع‌دهی biditexmaker ویرایشگر قالب beamer واژه‌نامه texstudio اندازه فونت عنوان فصل ماتریس شماره صفحه اعمال نشدن تغییرات در پی‌دی‌اف رسم جدول bidipresentation حاشیه رنگ عنوان شکل اسلاید فارسی محیط قضیه گراف حروف‌چینی کد مکان شکل شماره فصل enumerate tabriz_thesis tikzpicture نمایه align زیرنویس شکل کادر itemize الگوریتم فهرست اشکال listings عدم اجرا نیم‌فاصله فاصله بین خطوط متن لاتین و فارسی hyperref بسته قالب پایان‌نامه فرمول نصب تک‌لایو فارسی‌تک نمودار شماره فرمول glossaries کپشن حروف‌چینی چندستونی خروجی فونت فارسی و انگلیسی ماکرونویسی extrafootnotefeatures لاتک biditools شماره پاورقی پیوست‌ سوال امتحانی فاصله‌گذاری فرمول چندضابطه‌ای tex subfigure biditufte-book header texmaker pdf خطا longtable تصویر شمارنده زیرنویس texlive2015 دیاگرام میک‌تک رسم نمودار شماره‌گذاری صفحات پایان نامه فهرست جداول تورفتگی texlive2016 شعر بولد آکولاد kashida میکروسافت ورد تنظیم جدول سوال چهارگزینه‌ای قاب texworks caption اندیس فاصله عمودی lollipop چپ‌چینی iust-thesis multicol فصل‌نویسی tcolorbox اعداد فارسی pgfplots xindy اوبونتو geometry xelatex texlive کاما fancyhdr وسط‌چینی تک لایو 2015 شماره گذاری به‌روزرسانی بسته aimc46 شکست خط صفر توخالی فرمول طولانی قالب کتاب فونت اعداد بیرون‌زدگی bidipoem عنوان بخش پوستر فاصله سطرها نوشتافت tex-programming قرآن tabriz-thesis ایتالیک winedt جستجوی معکوس فلش جایابی تصویر فهرست تصاویر پاراگراف‌بندی بازیابی اطلاعات هایپرلینک فهرست نمادها شمارنده فصل حروف‌چینی شعر font محیط ریاضی minipage رسم کادر جداکننده جدول طولانی به‌روزرسانی شماره‌گذاری فرمول algorithm2e proof equation eps جدول افقی tabular عکس متن فارسی و انگلیسی پانویس چندستونی کمک مالی فاصله خطوط فونت بولد زیرشکل پانویس پاراگرافی ltrfootnote پیوست computeautoilg فرمول چندخطی persian-bib neveshtuft غلط‌گیری املایی فونت ریاضی پیکان لاتکس قلم baselineskip شماره قسمت عنوان جدول
...