چگونه HTML را با استفاده از C# به JSON تبدیل کنیم
تبدیل HTML به JSON به توسعه دهندگان اجازه می دهد تا داده های ساختاری را از فرمت های وب استخراج کنند و از آن در برنامه های مبتنی بر داده ها استفاده کنند. Aspose.Cells برای .NET به توسعه دهندگان اجازه می دهد تا فایل های HTML را بارگذاری کنند و محتوای خود را به عنوان JSON به طور موثر و برنامه ریزی شده صادر کنند.
چرا HTML را به JSON تبدیل می کنیم؟
قابلیت حمل و نقل اطلاعات :- انتقال داده های جدول HTML به سرویس های پشتیبان یا APIs به عنوان JSON.
تولید وب به اپلیکیشن:- جدول یا محتوای وب ساختار یافته را برای پردازش بیشتر در برنامه ها استخراج کنید.
آمادگی اتوماسیون :- ایده آل برای اتوماسیون فرایندهای استخراج وب یا استخراج محتوا.
راهنمای گام به گام برای تبدیل HTML به JSON
مرحله 1: نصب Aspose.Cells از طریق NuGet
نصب Aspose.Cells برای .NET:
dotnet add package Aspose.Cells
مرحله دوم: تنظیم مجوز
امکان عملکرد کامل :
Metered matered = new Metered();
matered.SetMeteredKey("PublicKey", "PrivateKey");
مرحله 3: فایل HTML را بارگذاری کنید
ایجاد یک دفترچه کار جدید با بارگذاری ورودی HTML:
Workbook workbook = new Workbook("Sample.html");
مرحله چهارم: دسترسی به آخرین سلول
شناسایی آخرین سلول در ورق کار برای تعریف مرزهای صادرات:
Cell lastCell = workbook.Worksheets[0].Cells.LastCell;
مرحله پنجم: محدوده صادرات را تعیین کنید
یک محدوده ایجاد کنید که داده های ورق را گسترش می دهد:
Range range = workbook.Worksheets[0].Cells.CreateRange(0, 0, lastCell.Row + 1, lastCell.Column + 1);
مرحله 6: تنظیم JsonSaveOptions
انتخاب گزینه های صادرات:
JsonSaveOptions options = new JsonSaveOptions();
مرحله 7: صادرات به JSON
محدوده مشخص شده را به JSON سریالی کنید:
string jsonData = Aspose.Cells.Utility.JsonUtility.ExportRangeToJson(range, options);
مرحله 8: JSON را به فایل ذخیره کنید
صفحه را به دیسک بفرستید:
System.IO.File.WriteAllText("htmltojson.json", jsonData);
مشکلات و اصلاحات مشترک
1- خروجی خالی
- راه حل: اطمینان حاصل کنید که فایل HTML حاوی محتوای ساختاری مبتنی بر جدول برای تشخیص داده های معتبر است.
۲- محدوده نادرست
- راه حل: دوگانه چک کنید که محدوده شامل تمام سلول های مربوطه از ورق کار است.
3- فرمت صادرات
- Solution: Use
JsonSaveOptions
to control sheet indexing, skip empty rows, or customize hyperlinks.