【实用教程】.NET C# PDF 生成技术：哪种方法适合您的项目？

🕗 发布于 2024-11-05 18:21 pdf .net c#

概述：本文介绍了 TX Text Control 真正的 WYSIWYG（所见即所得）模板系统所带来的独特优势，与传统的 PDF 生成系统（如 HTML 到 PDF 转换器或需要自定义编程的 PDF 库）相比，模板是可视化设计的，类似于 Microsoft Word。

TX Text Control 是一款功能类似于 MS Word 的文字处理控件，包括文档创建、编辑、打印、邮件合并、格式转换、拆分合并、导入导出、批量生成等功能。广泛应用于企业文档管理，网站内容发布，电子病历中病案模板创建、病历书写、修改历史、连续打印、病案归档等功能的实现。

在文档处理应用程序中比较文档的策略有很多。最常见的方法之一是逐字比较文档的文本。这是一种简单有效的文档比较方法，但它确实有一些局限性。

TX Text Control 最新下载

当您在应用程序开发中接到创建 PDF 文档的任务时，您会进行研究并找到许多不同的工具来帮助您完成这项工作。当然，您可以尝试自己创建 PDF，方法是研究最新的 PDF 2.0 规范（ISO 32000：2：2020）的约 1000 页，其中包含有关 PDF 文件格式、渲染、加密和其他功能的所有技术细节。但让我们面对现实：这是一项巨大的时间投入，有整个公司都在处理此事（例如我们 - Text Control）。

第一步是确定要创建哪种类型的 PDF 文档，最重要的是要确定要创建多少个。当涉及到 PDF 创建过程所需的灵活性时，这一决定至关重要。决策过程中还应考虑许多其他方面。

您是否需要从头开始创建 PDF 或者您是否拥有可以重复使用的现有文档？
您需要创建多少种不同类型的文档（以及将来需要创建多少种不同类型的文档！）？
组织中的哪个角色应该能够对文档或模板进行更改，例如更改徽标？

仅这三个问题就可以开启一个完整的思考过程，即文档生成过程应该如何模块化和易于维护。

HTML 到 PDF 的转换

开发人员的一个非常普遍的想法是使用工具将 HTML 转换为 PDF。理由听起来很正确，因为作为开发人员，我们知道如何编写 HTML，并且对 HTML 和 CSS 样式充满信心。因此，此过程的基本思想是开发人员使用 CSS 创建 HTML，转换器根据该输入创建 PDF。流行的库包括 wkhtmltopdf、Puppeteer 和 Headless Chrome。

优点：

熟悉的标记：轻松创建 HTML 和 CSS。
动态内容：轻松创建动态内容。
快速结果：快速实施。

缺点：

不一致的渲染：由于渲染引擎对 HTML/CSS 的解释方式不同，HTML 到 PDF 转换器可能难以实现一致的布局和样式。
复杂布局： HTML 不是为打印精度而设计的，因此很难实现精确定位、对齐或特定于页面的布局（例如固定的页眉和页脚）。
性能：复杂或大型的 HTML 文档会减慢 PDF 创建过程。

对于简单文档或需要从网页创建 PDF 时，HTML 到 PDF 的转换是一个不错的选择。但是对于发票、报告或合同等复杂文档，HTML 到 PDF 转换器有其局限性。

程序化 PDF 生成

了解了 HTML 方法的局限性之后，使用一种能够更精确地定位元素的方法似乎是显而易见的。

程序化 PDF 创建是使用编程接口创建 PDF 文档的过程。这种方法更加灵活，允许您创建具有精确布局和样式的复杂文档。在您的代码中，您基本上将某些元素定位在页面上的 x 和 y 坐标上。

优点：

精细控制：页面上元素的精确定位。
定制：完全控制文档的布局和样式。
一致性：由于布局是编码的，因此平台之间出现不一致的风险较小。

缺点：

劳动密集型：开发人员必须手动定义和定位每个元素，这对于复杂的文档来说可能是一个耗时的过程。
需要编程技能：非技术用户无法创建或自定义模板，因此任何更改都需要开发人员的干预。
手动分页：开发人员必须明确处理分页符和溢出内容，这增加了编码过程的复杂性。

对于需要精确布局和样式的复杂文档，程序化 PDF 生成是一个不错的选择。但是，它可能非常耗时，并且需要编程技能来创建和维护模板。

以下代码片段使用 QuestPDF，这是一个用于创建 PDF 文档的开源 .NET 库。该代码基本上将文本添加到标题中，您已经可以看到这提供了一种灵活的方式，但所有元素都必须以编程方式定位，并且静态文本也嵌入到代码中。

void ComposeHeader(IContainer container)
{
    var titleStyle = TextStyle.Default.FontSize(20).SemiBold().FontColor(Colors.Blue.Medium);

    container.Row(row =>
    {
        row.RelativeItem().Column(column =>
        {
            column.Item().Text($"Invoice #{Model.InvoiceNumber}").Style(titleStyle);
            column.Item().Text(text =>
            {
                text.Span("Issue date: ").SemiBold();
                text.Span($"{Model.IssueDate:d}");
            });
            column.Item().Text(text =>
            {
                text.Span("Due date: ").SemiBold();
                text.Span($"{Model.DueDate:d}");
            });
        });
        row.ConstantItem(100).Height(50).Placeholder();
    });
}

更高的维护和技术债务

由于程序化 PDF 中的布局逻辑嵌入在代码中，因此任何模板调整都需要更改代码，即使是微小的调整也是如此。这会导致：

设计变更的反馈循环更长。
依赖开发人员进行模板调整，限制灵活性。
维护成本更高，因为模板或业务规则的更新需要持续的开发时间。

基于模板的 PDF 生成

基于模板的系统允许用户直观地设计 PDF 模板，通常使用与文字处理器非常相似的拖放界面。此设置允许 WYSIWYG（所见即所得）设计，其中模板看起来与最终输出完全相同。

TX Text Control 不仅可用于从头开始编写 PDF（如第二种方法中所述），还可用于使用 WYSIWYG 模板的最灵活方法。TX Text Control 附带一个功能齐全、可自定义且可编程的文档编辑器，可集成到 Web 应用程序中，让非技术用户创建像素完美的模板。SDK 还提供了一个非 UI 引擎，可完全嵌入到采用此模板并将来自各种数据源的数据合并到模板中的应用程序中。

这个概念不仅让您能够为用户提供一个非常易于使用的模板创建界面，而且还为您在合并过程中提供充分的灵活性。

优点：

用户友好型设计：所见即所得的设计工具允许非开发人员轻松创建模板，从而让更广泛的用户可以使用。
动态且一致的布局：基于模板的系统自动管理分页符和内容溢出，确保一致的布局，而无需自定义代码。
高保真输出：用户可以准确地看到他们的文档的外观，从而减少了测试和修改的需要。
MS Word 兼容性：可以从 Microsoft Word 导入和导出模板，从而轻松重复使用现有文档。

缺点：

学习曲线：开发人员需要学习如何将模板系统集成到他们的应用程序中。

TX Text Control 将强大的动态文档生成功能（如合并字段、重复和条件合并块）与易于使用的模板设计相结合。

以下代码使用 TX Text Control 加载预先设计的模板并将 JSON 数据合并到其中以创建像素完美的 PDF。

using TXTextControl.DocumentServer.Fields;

using (TXTextControl.ServerTextControl tx = new TXTextControl.ServerTextControl())
{
    tx.Create();

    TXTextControl.LoadSettings ls = new TXTextControl.LoadSettings()
    {
        ApplicationFieldFormat = TXTextControl.ApplicationFieldFormat.MSWord,
        LoadSubTextParts = true
    };

    tx.Load("template.docx", TXTextControl.StreamType.WordprocessingML, ls);

    using (TXTextControl.DocumentServer.MailMerge mailMerge =
      new TXTextControl.DocumentServer.MailMerge())
    {
        var jsonData = System.IO.File.ReadAllText("data.json");

        mailMerge.TextComponent = tx;
        mailMerge.MergeJsonData(jsonData);
    }

    tx.Save("output.pdf", TXTextControl.StreamType.AdobePDF);
}

结论

每种方法都有不同的用途，选择方法通常取决于文档类型、布局复杂程度和可用的技术专长。TX Text Control 等解决方案具有所见即所得的设计和灵活的数据合并功能，提供了理想的折中方案，将模板设计的视觉简洁性与强大的 PDF 生成功能相结合。

原文地址：https://blog.csdn.net/qq_36129733/article/details/143423516

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【1个月速成Java】基于Android平台开发个人记账app学习日记——第2天，启动项目
下一篇：C#的起源。J++语言的由来?J#和J++傻傻分不清?

python包管理工具pip和conda的使用对比
pip相对于conda,对应包的依赖关系管理不强，坏处是容易造成包冲突，好处是对于一些特定需要，可以避免处理包依赖关系，直接使用pip安装。一般deactivate 两次即可。2.1.0是相应包的版本
阅读更多2024-11-08
github.io出现的问题及解决方案
手动修改DNS，尝试过很多个DNS解析服务，只有首选DNS服务器设置为114.114.114.114，备用设置为208.67.222.222成功了一个下午，之后莫名打回原形，使用DNS jupmpe
阅读更多2024-11-08
HTML 块级元素和内联（行内）元素详解
块级元素是页面中的结构元素，它们独占一行，通常用于搭建页面的主要框架，如段落、容器、标题等。它们无论其内容多少，都会占据父元素的整个宽度。这种特性使得块级元素特别适合用于页面的整体布局和内容的分区组织
阅读更多2024-11-08
ACM社团第一次测试题解（禁止直接复制粘贴提交）
思路：解法一：暴力比较，两个数之间一直比较得出中位数解法二：快排函数，数组中间值即为中位数代码：1.c语言版：2.c++版：求和：思路：判断是否有两个数相加为第三个数即可代码：1.c语言版：2.c++
阅读更多2024-11-08
机器学习——排序特征（Ranking Features）原理详解
通过以上步骤，我们了解了排序特征的原理及实现过程。排序特征通过特征工程和点对、列表排序算法学习样本之间的相对顺序。RankNet 模型实现了点对比较，通过神经网络生成特征的排序分数。代码实现展示了如何
阅读更多2024-11-08
Django安装
在 Django 项目中，app是一个功能模块，它包含了特定的业务逻辑、数据模型和视图，是 Django 项目结构化管理的核心部分。python manage.py startapp app文件名称。
阅读更多2024-11-08
Centos 下安装 jsoncpp 库、bundle 数据压缩库、httplib 库 -- 详细教程
Centos 下安装 jsoncpp 库、bundle 数据压缩库、httplib 库
阅读更多2024-11-08
Linux（CentOS）安装 Nginx
Linux（CentOS）安装 Nginx。
阅读更多2024-11-08
golang笔记
本应在栈中内存,被分配到了堆中1 返回指针对象在外部被使用2 reutrn 函数使用了上面方法的敞亮3 入参是interface{} 动态参数4 make超过栈大小-gcflags="-
阅读更多2024-11-08
webworker
总结：js异步是始终要回到主线程的，webworker是不需要回到主线程，它自己创建一条线程自己去操作，这样主线程就可以不用管它，等它计算完了后，它可以主动把计算结果发给主线程（得主动发，不然收不到）
阅读更多2024-11-08

【实用教程】.NET C# PDF 生成技术：哪种方法适合您的项目？

相关文章