تجزیه و ترسیم نقشه Docx با جاوا

عکس پروفایل نویسنده

@ارزنیکاوگنیج رزنیک

توسعه دهنده نرم افزار از آلمان

در اینجا من به شما نشان می دهم که چگونه یک فایل docx را تجزیه کرده و آن را روی یک شی Java (POJO) ترسیم کنید. کد نهایی را می توانید از این مثال در اینجا بارگیری کنید: https://github.com/e-reznik/DocxJavaMapper-example.

پیشینه فنی

Docx یک قالب استاندارد اسناد است که برای اولین بار در سال 2007 با انتشار Microsoft Office 2007 ارائه شد. این اسناد را به عنوان مجموعه ای از پوشه ها و پرونده های جداگانه در بایگانی zip ذخیره می کند ، برخلاف قالب Doc قدیمی که از پرونده های باینری استفاده می کند. پرونده های Docx را می توان با Microsoft Word 2007 به بعد و توسط برخی از محصولات دفتر منبع باز مانند LibreOffice و OpenOffice باز کرد. برای مشاهده ساده محتوای یک docx ، پسوند آن را به .zip تغییر دهید و بایگانی حاصل را با استفاده از هر بایگانی کننده پرونده مشاهده کنید.

محتوای اصلی در پرونده document.xml در کلمه پوشه قرار دارد. این متن شامل متن واقعی و برخی از اطلاعات یک ظاهر طراحی شده کل سند است. این فایلی است که در این آموزش بر روی آن تمرکز خواهیم کرد. اطلاعات دقیق در مورد ساختار یک docx را می توان در http://officeopenxml.com/anatomyofOOXML.php مشاهده کرد.

ابتدا بایگانی docx را استخراج می کنیم. در مرحله بعد ، ما فایل word / document.xml را با یک شی Java که می تواند برای پردازش بیشتر مورد استفاده قرار گیرد ، می خوانیم و ترسیم می کنیم.

ایجاد یک نمونه پرونده docx

ما باید یک docx ساده بسازیم که …

سئو PBN | خبر های جدید سئو و هک و سرور