如何用html写书

daxiangcai 2023-03-28 原文

原理：利用xml.etree.ElementTree对html进行解析和写入

# encoding=utf-8
import xml.etree.ElementTree as ET  # 解析html、xml

name = input('type in file name:')


def circle():
    tree = ET.parse(f'{name}.html')  # 解析文件
    root = tree.getroot()  # 获取根节点
    link_div = root.find('div[@id="link"]')  # 获取link区的div节点。注意find和findall只能查找直接子元素
    body_div = root.find('div[@id="body"]')  # 获取body区的div节点
    h1List = link_div.findall('div')
    for i in h1List:  # 列出所有h1标题
        print(i.find('h1').find('a').text)

    def create_h1():  # 创造h1节点
        tree = ET.parse(f'{name}.html')  # 用于刷新节点
        root = tree.getroot()  # 获取根节点
        link_div = root.find('div[@id="link"]')
        body_div = root.find('div[@id="body"]')
        h1List = link_div.findall('div')
        print('输入again回到程序开始处，输入exit退出程序')
        h1_text = input('输入章节名：')
        if h1_text == 'again':
            circle()
        elif h1_text == 'exit':
            print('program terminated!')
        else:
            page = input('页数：')
            h1_link_div = ET.Element('div')  # 创造节点
            h1_link_h1 = ET.Element('h1')
            h1_link_a = ET.Element('a')
            h1_link_a.text = f'{len(h1List) + 1}、' + h1_text + '（p' + page + '）'
            h1_link_a.set('href', f'#{len(h1List) + 1}')  # 设置a节点的属性
            h1_link_h1.append(h1_link_a)  # 悬挂节点
            h1_link_div.append(h1_link_h1)
            link_div.append(h1_link_div)  # 写入link区
            h1_body_div = ET.Element('div')  # 创造节点
            h1_body_h1 = ET.Element('h1')
            h1_body_h1_a = ET.Element('a')
            h1_body_h1_a.text = '回到顶部'  # 设置回到顶部的链接
            h1_body_h1_a.set('href', '#link')
            h1_body_h1.text = f'{len(h1List) + 1}、' + h1_text + '（p' + page + '）'
            h1_body_div.set('id', f'{len(h1List) + 1}')
            h1_body_div.append(h1_body_h1)
            h1_body_div.append(h1_body_h1_a)
            body_div.append(h1_body_div)  # 写入body区
            newTree = ET.ElementTree(root)  # root为修改后的root
            newTree.write(f'{name}.html', encoding='utf-8')  # 重新写入xml，进行更新。需要声明编码，否则写入后会乱码
            create_h1()

    def create_h2():  # 创造h2节点
        tree = ET.parse(f'{name}.html')  # 用于刷新节点
        root = tree.getroot()  # 获取根节点
        link_div = root.find('div[@id="link"]')
        body_div = root.find('div[@id="body"]')
        h1List = link_div.findall('div')
        h2List = link_div.findall('div')[int(a) - 1].findall('div')
        print('输入again回到程序开始处，输入exit退出程序')
        h2_text = input('输入章节名：')
        if h2_text == 'again':
            circle()
        elif h2_text == 'exit':
            print('program terminated!')
        else:
            page = input('页数：')
            h2_link_div = ET.Element('div')
            h2_link_h2 = ET.Element('h2')
            h2_link_a = ET.Element('a')
            h2_link_a.text = a + f'.{len(h2List) + 1}、' + h2_text + '（p' + page + '）'
            h2_link_a.set('href', '#' + a + f'_{len(h2List) + 1}')
            h2_link_h2.append(h2_link_a)
            h2_link_div.append(h2_link_h2)
            h1List[int(a) - 1].append(h2_link_div)
            h2_body_div = ET.Element('div')
            h2_body_h2 = ET.Element('h2')
            h2_body_h2_a = ET.Element('a')
            h2_body_h2_a.text = '回到顶部'
            h2_body_h2_a.set('href', '#link')
            h2_body_h2.text = a + f'.{len(h2List) + 1}、' + h2_text + '（p' + page + '）'
            h2_body_div.set('id', a + f'_{len(h2List) + 1}')
            h2_body_div.append(h2_body_h2)
            h2_body_div.append(h2_body_h2_a)
            body_div.findall('div')[int(a) - 1].append(h2_body_div)
            newTree = ET.ElementTree(root)
            newTree.write(f'{name}.html', encoding='utf-8')
            create_h2()

    def create_statement():  # 创造h2下的内容
        tree = ET.parse(f'{name}.html')  # 用于刷新节点
        root = tree.getroot()  # 获取根节点
        body_div = root.find('div[@id="body"]')
        h2 = body_div.findall('div')[int(a) - 1].findall('div')[int(b) - 1]
        print('输入again回到程序开始处，输入exit退出程序')
        p_text = input('输入内容：')
        if p_text == 'again':
            circle()
        elif p_text == 'exit':
            print('program terminated!')
        else:
            page = input('页数：')
            p = ET.Element('p')
            p.text = p_text + '（p' + page + '）'
            h2.append(p)
            newTree = ET.ElementTree(root)
            newTree.write(f'{name}.html', encoding='utf-8')
            create_statement()

    print('在此处创建输入0\n选择章节输入序号')
    a = input('输入：')  # 输入的为字符串而非数字
    if a == '0':
        create_h1()
    else:
        h2List = link_div.findall('div')[int(a) - 1].findall('div')
        for i in h2List:  # 列出所有h2标题
            print(i.find('h2').find('a').text)
        print('在此处创建输入0\n选择章节输入序号')
        b = input('输入：')
        if b == '0':
            create_h2()
        else:
            h2 = body_div.findall('div')[int(a) - 1].findall('div')[int(b) - 1]  # 选择的h2节点
            pList = h2.findall('p')  # 列出所有h2标题下的内容
            for i in pList:
                print(i.text)
            create_statement()


circle()  # 循环往复

注意千万要仔细检查，本人就是因为某个变量打错字了，没有发现，耽搁了很久……总之现在是顺利地解决了

何用 html br div body Python

有关如何用html写书的更多相关文章

ruby - 使用 ruby 将 HTML 转换为纯文本并维护结构/格式 - 2
我想将html转换为纯文本。不过，我不想只删除标签，我想智能地保留尽可能多的格式。为插入换行符标签，检测段落并格式化它们等。输入非常简单，通常是格式良好的html(不是整个文档，只是一堆内容，通常没有anchor或图像)。我可以将几个正则表达式放在一起，让我达到80%，但我认为可能有一些现有的解决方案更智能。最佳答案首先，不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案，它会随着HTML的变化而崩溃，或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
ruby-on-rails - Rails HTML 请求渲染 JSON - 2
在我的Controller中，我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时，它会自然地以HTML呈现。但是，当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法)，我仍然将HTML作为响应。如何获取JSON作为响应？我还需要说明什么？最佳答案您应该将.json附加到请求的url，提供的格式在routes.rb的路径中定义。这
ruby-on-rails - 使用 Sublime Text 3 突出显示 HTML 背景语法中的 ERB？ - 2
所以我在关注Railscast，我注意到在html.erb文件中，ruby代码有一个微弱的背景高亮效果，以区别于其他代码HTML文档。我知道Ryan使用TextMate。我正在使用SublimeText3。我怎样才能达到同样的效果？谢谢! 最佳答案为SublimeText安装ERB包。假设您安装了SublimeText包管理器*，只需点击cmd+shift+P即可获得命令菜单，然后键入installpackage并选择PackageControl:InstallPackage获取包管理器菜单。在该菜单中，键入ERB并在看到包时选择
ruby-on-rails - Ruby url 到 html 链接转换 - 2
我正在使用Rails构建一个简单的聊天应用程序。当用户输入url时，我希望将其输出为html链接(即“url”)。我想知道在Ruby中是否有任何库或众所周知的方法可以做到这一点。如果没有，我有一些不错的正则表达式示例代码可以使用... 最佳答案查看auto_linkRails提供的辅助方法。这会将所有URL和电子邮件地址变成可点击的链接(htmlanchor标记)。这是文档中的代码示例。auto_link("Gotohttp://www.rubyonrails.organdsayhellotodavid@loudthinking.
ruby-on-rails - capybara ::ElementNotFound:无法找到 xpath "/html" - 2
我正在学习http://ruby.railstutorial.org/chapters/static-pages上的RubyonRails教程并遇到以下错误StaticPagesHomepageshouldhavethecontent'SampleApp'Failure/Error:page.shouldhave_content('SampleApp')Capybara::ElementNotFound:Unabletofindxpath"/html"#(eval):2:in`text'#./spec/requests/static_pages_spec.rb:7:in`(root)'
ruby - 如何使用 Ruby 将 CSV 文件读入 HTML 表格？ - 2
我正在尝试将一个简单的CSV文件读入HTML表格以在浏览器中显示，但我遇到了麻烦。这就是我正在尝试的:Controller:defshow@csv=CSV.open("file.csv",:headers=>true)end查看:输出:NameStartDateEndDateQuantityPostalCode基本上我只获取标题，而不会读取和呈现CSV正文。最佳答案这最终成为最终解决方案:Controller:defshow#OpenaCSVfile,andthenreaditintoaCSV::Tableobjectforda
ruby - 如何使用 Nokogiri 解析纯 HTML 表格？ - 2
我想用Nokogiri解析HTML页面。页面的一部分有一个表，它没有使用任何特定的ID。是否可以提取如下内容:Today,3,455,34Today,1,1300,3664Today,10,100000,3444,Yesterday,3454,5656,3Yesterday,3545,1000,10Yesterday,3411,36223,15来自这个HTML:TodayYesterdayQntySizeLengthLengthSizeQnty345534345456563113003664354510001010100000344434113622315
ruby-on-rails - 连接字符串时如何在 <%=%> block 内输出 html_safe？ - 2
考虑一下:现在这些情况:#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2#output:http://domain.com/?foo=1&bar=2我需要用其他字符串输出URL。我如何保证＆符号不会被转义？由于我无法控制的原因，我无法发送&。求助!把我的头发拉到这里:\编辑:为了澄清，我实际上有一个像这样的数组:@images=[{:id=>"fooid",:url=>"http://
ruby-on-rails - 如何用不同的用户运行nginx主进程 - 2
A/ctohttp://wiki.nginx.org/CoreModule#usermaster进程曾经以root用户运行，是否可以以不同的用户运行nginxmaster进程？最佳答案只需以非root身份运行init脚本(即/etc/init.d/nginxstart)，就可以用不同的用户运行nginxmaster进程。如果这真的是你想要做的，你将需要确保日志和pid目录(通常是/var/log/nginx&/var/run/nginx.pid)对该用户是可写的，并且您所有的listen调用都是针对大于1024的端口(因为绑定(
ruby - 如何用递增的值填充数组 Ruby - 2
我正在尝试解决http://projecteuler.net/problem=1.我想创建一个方法，它接受一个整数，然后创建一个包含它前面的所有整数的数组，并将整数本身作为数组中的值。以下是我目前所拥有的。代码不起作用。defmake_array(num)numbers=Array.newnumcount=1numbers.eachdo|number|numbers 最佳答案 (1..num).to_a是您在Ruby中需要做的全部。1..num将创建一个Range对象，以1开始并以任意值num结束是。Range对象有to_a方法通过

如何用html写书

有关如何用html写书的更多相关文章

随机推荐