اولین بار است که به اینجا می‌آیید؟ راهنمای سایت را بخوانید!
Close Sidebar
وب‌سایت پرسش و پاسخ پارسی‌لاتک جایی برای پرسش و پاسخ درباره سیستم حروف‌چینی لاتک و بسته زی‌پرشین است. در اینجا می‌توانید سوال‌های خود را بپرسید و به سوال‌های دیگران پاسخ دهید.

محبوب‌ترین برچسب‌ها

رفع خطا جدول مراجع xepersian ریاضی‌نویسی شکل فونت فهرست مطالب شماره‌گذاری منابع bidi پانویس بیب‌تک tikz تک‌لایو parsilatex بیمر اسلاید زی‌پرشین پاورقی bibtex سربرگ نماد رسم شکل فرمول‌نویسی قالب ارجاع‌دهی biditexmaker هدر ویرایشگر beamer واژه‌نامه اندازه فونت texstudio عنوان فصل ماتریس اعمال نشدن تغییرات در پی‌دی‌اف رسم جدول bidipresentation شماره صفحه حاشیه رنگ عنوان شکل اسلاید فارسی محیط قضیه گراف مکان شکل tikzpicture حروف‌چینی کد شماره فصل enumerate tabriz_thesis نمایه align زیرنویس شکل کادر itemize فهرست اشکال الگوریتم listings عدم اجرا نیم‌فاصله متن لاتین و فارسی بسته فاصله بین خطوط قالب پایان‌نامه فرمول نصب تک‌لایو فارسی‌تک hyperref شماره فرمول glossaries کپشن نمودار خروجی لاتک حروف‌چینی چندستونی فونت فارسی و انگلیسی ماکرونویسی biditools شماره پاورقی پیوست‌ سوال امتحانی فاصله‌گذاری فرمول چندضابطه‌ای subfigure extrafootnotefeatures header texmaker pdf tex biditufte-book longtable تصویر شمارنده texlive2015 زیرنویس خطا رسم نمودار شماره‌گذاری صفحات پایان نامه دیاگرام فهرست جداول میک‌تک texlive2016 تنظیم جدول آکولاد kashida texworks caption اندیس lollipop iust-thesis multicol فصل‌نویسی شعر سوال چهارگزینه‌ای بولد تورفتگی اعداد فارسی فاصله عمودی xindy چپ‌چینی اوبونتو میکروسافت ورد قاب geometry texlive fancyhdr وسط‌چینی تک لایو 2015 عنوان بخش شماره گذاری به‌روزرسانی بسته aimc46 صفر توخالی فرمول طولانی بیرون‌زدگی xelatex کاما tcolorbox پوستر فاصله سطرها نوشتافت شکست خط tex-programming فونت اعداد pgfplots قرآن tabriz-thesis ایتالیک winedt جستجوی معکوس فلش جایابی تصویر قالب کتاب پاراگراف‌بندی بازیابی اطلاعات هایپرلینک فهرست نمادها شمارنده فصل font محیط ریاضی رسم کادر جداکننده جدول طولانی فهرست تصاویر شماره‌گذاری فرمول algorithm2e فونت بولد proof equation bidipoem eps جدول افقی عکس به‌روزرسانی پانویس چندستونی کمک مالی فاصله خطوط حروف‌چینی شعر زیرشکل minipage قلم پانویس پاراگرافی ltrfootnote پیوست computeautoilg متن فارسی و انگلیسی فرمول چندخطی neveshtuft غلط‌گیری املایی تک‌پارسی پیکان لاتکس tabular baselineskip شماره قسمت قسمت عنوان جدول
5 نفر آنلاین
0 عضو و 5 مهمان در سایت حاضرند
بازدید امروز: 4011
بازدید دیروز: 9762
بازدید کل: 25088078

تعداد کلمات، و حروف در کل متن

0 رای
2,233 بازدید

با سلام

بنده می خوام بدونم که تو PDF حاصل از حروف چینی در لاتک، با چه دستوری میتونم از تعداد کل کلمات و حروف استفاده شده در متن مطلع شوم. به عنوان مثال، یک فایل ضمیمه شده است.

با تشکر

سوال شده تیر 12, 1396 توسط amirele90 (5 امتیاز)
برچسب گذاری دوباره تیر 13, 1396 توسط وحید دامن‌افشان

2 پاسخ

+2 رای

اگر به لینکی که آقای مسهر باقری داده‌اند نگاه کنید می‌بینید که برای شمارش تعداد کلمات باید از یک ابزار خارجی استفاده کنید.

هر چند اگر کمی فکر کنید متوجه می‌شوید که در متن کلمات بصورت زیر از هم جدا می‌شوند:

  • حرف و فاصله
  • حرف و کاما
  • حرف و نقطه

بنابراین شمارش تعداد کلمات بسیار راحت هست تنها باید از دستورات بدوی \XeTeXcharclass و \XeTeXinterchartoks استفاده کنید.

\documentclass{article}
\usepackage{color}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyComma
\XeTeXcharclass`\،\MyComma
\XeTeXcharclass`\,\MyComma
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \MyComma = {\PrintWordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\PrintWordCount}
\newcommand*{\PrintWordCount}{\raise.8\baselineskip\llap{\tiny\global\advance\WordCount\@ne\textcolor{red}{\the\WordCount}}}
\makeatother
\begin{document}
\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}

enter image description here

enter image description here

همانطور که در خروجی می‌بینید این نوشتار ۱۳۳۵ کلمه دارد.

توضیح کد

الفبای پارسی و انگلیسی را داخل یک کلاس و کاما را هم داخل کلاسی دیگر قرار می‌دهیم. هرگاه بعد از حرفی فاصله، نقطه و یا کاما وجود داشت یک شماره به شمارنده کلمات می‌افزاییم و شماره کلمه را در بالای کلمه چاپ می‌کنیم.

پاسخ داده شده تیر 13, 1396 توسط وفا (24,432 امتیاز)
مثل همیشه بسیار زیبا و جذاب


به نظرم اگر حوصله دارید و این را در قالب یک بسته ارائه دهید خیلی کاربردی خواهد بود.
برای مثال، در چکیده پایان‌نامه دانشجویان و یا مقالات تعداد کلمات از حدی معینی نباید تجاوز نماید. با تعریف دستورات فوق در قالب یک محیط کاربر می‌تواند از تعداد صحیح آن‌ها اطمینان یابد.
این کد خیلی ساده‌ای. برای بسته نه ولی همین نمونه رو آقای امین‌طوسی و یا سایر دوستان می‌تونند به نمونه‌های موجود در دی‌وی‌دی پارسی‌لاتک اضافه کنند.
شاید برای شما ساده باشد لکن به نظرم برای خیلی‌ها کاربردی خواهد بود.
و صد البته از بسته emptypage که قطعا ساده‌تر نیست؟!
+1 رای

در مقایسه با پاسخ قبلی این پاسخ کامل‌تر است. تفاوت‌های این پاسخ با پاسخ قبلی بصورت زیر است:

\MyComma به \MyPunctuations تغییر کرده.

تعداد بیشتری علامت‌های نگارشی که در آخر حرف ممکن است قرار بگیرد در نظر گرفته شده است و بنابراین تشخیص کلمه هوشمندتر شده است.

به جای چاپ شماره کلمات در بالای هر کلمه که ممکن است خیلی شلوغ شود، دستور \PrintWordCount تنها تعداد کل کلمات در تمام نوشتار را چاپ می‌کند و برای چاپ صحیح تعداد کلمات احتیاج به دوبار اجرا است. اطلاعات مربوط به تعداد کلمات هر بار در انتهای نوشتار به فایل .aux نوشته می‌شود.

\documentclass{article}
\usepackage{lipsum}
\usepackage{ptext}
\usepackage{xepersian}
\settextfont{Yas}
\makeatletter
\newcount\WordCount
\newcount\My@Alphabets
\newXeTeXintercharclass\MyAlphabets
\newXeTeXintercharclass\MyPunctuations
\XeTeXcharclass`\{\MyPunctuations
\XeTeXcharclass`\}\MyPunctuations
\XeTeXcharclass`\[\MyPunctuations
\XeTeXcharclass`\]\MyPunctuations
\XeTeXcharclass`\(\MyPunctuations
\XeTeXcharclass`\)\MyPunctuations
\XeTeXcharclass`\`\MyPunctuations
\XeTeXcharclass`\'\MyPunctuations
\XeTeXcharclass`\!\MyPunctuations
\XeTeXcharclass`\:\MyPunctuations
\XeTeXcharclass`\;\MyPunctuations
\XeTeXcharclass`\?\MyPunctuations
\XeTeXcharclass`\؟\MyPunctuations
\XeTeXcharclass`\«\MyPunctuations
\XeTeXcharclass`\»\MyPunctuations
\XeTeXcharclass`\،\MyPunctuations
\XeTeXcharclass`\,\MyPunctuations
\My@Alphabets=`\آ \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\ی \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\A \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\Z \advance\My@Alphabets \@ne \repeat
\My@Alphabets=`\a \loop \XeTeXcharclass \My@Alphabets=\MyAlphabets \ifnum\My@Alphabets<`\z \advance\My@Alphabets \@ne \repeat
\XeTeXinterchartoks \MyAlphabets 4095 = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \MyPunctuations = {\AddTo@WordCount}
\XeTeXinterchartoks \MyAlphabets \bidi@dot@charclass = {\AddTo@WordCount}
\newcommand*{\AddTo@WordCount}{\global\advance\WordCount\@ne}
\newcommand*{\PrintWordCount}{\textbf{??}}
\newcommand*{\@PrintWordCount}[1]{\gdef\PrintWordCount{#1}}
\AtEndDocument{%
\protected@write\@auxout{}{\string\@PrintWordCount{\the\WordCount}}}
\makeatother
\begin{document}
\fbox{%
این نوشتار دارای
\PrintWordCount{}
کلمه
می‌باشد.%
}

\ptext
\begin{latin}
\lipsum
\end{latin}
\end{document}
پاسخ داده شده تیر 15, 1396 توسط وفا (24,432 امتیاز)
خیلی عالی. به عنوان پیشنهاد برای جلوگیری از شلوغ شدن هنگام شماره‌گذاری بالای هر کلمه می‌توان این کار را برای هر ۲۰ یا ۳۰ کلمه انجام داد و یا حتی آخرین کلمه هر پاراگراف.
خیلی ممنون هستم از پاسختون. بالاخره متوجه شدم چجوری باید از این کد استفاده کنم! خیلی ممنونم. ولی خیلی کُد پیچیده ای بود! برای من که مبتری هستم در لاتک فهمش واقعا مشکله! ولی کار بنده راه افتاد. بسیار بسیار سپاسگذارم از لطفتون
من پیچیدگی نمی‌بینم. در پاسخ قبلی که شماره هر کلمه با رنگ قرمز بالای هر کلمه چاپ میشه. در این پاسخ هم \PrintWordCount تعداد کل کلمات رو در نوشتار به شما نشون می‌دهد.
سلام برای من اجرا نمیشه و ارور میده!
...