自学内容网 自学内容网

Python爬虫下载新闻,Flask展现新闻(2)

上篇讲了用Python从新闻网站上下载新闻,本篇讲用Flask展现新闻。关于Flask安装网上好多教程,不赘述。下面主要讲 HTML-Flask-数据 的关系。

简洁版

如图,页面简单,主要显示新闻标题。

分页,使用最简单的分页技术,不用ajax,在链接中增加页码参数 /txw/1 ,由flask根据参数返回新闻。

flask路由代码:

#今日头条
@app.route('/txw')
@app.route('/txw/<page>')

def today_news(page=1):

    ua = request.headers.get('User-Agent')
    mb = from_mobile(ua)

    #移动端和PC端
    file = "day_news_m.html" if mb else "day_news.html"

    news = daily_news(page)
    return render_template(file,news = news)

每天下载的新闻用文件保存。注,每条新闻设置一个id,分页就是根据id返回。比如现在最新id是10000,每页显示100页, 链接/txw/1 表示 返回id 小于10000大于9900的新闻。

复杂版,按不同频道聚合新闻,包括标题、摘要、热点、收藏等功能,其它比如HTML+CSS设置导航栏后面再讲。

新闻频道划分如下

最新:最新下载的新闻;

关注:根据设置的新闻关键词聚合新闻,这是根据自己的设定来筛选新闻,不是推荐;

要闻:宏观、政策类新闻;

时事:国际政治、军事、局势新闻;

快讯:跟股市相关的突发新闻;

财经:财经类新闻;

科技:半导体、TMT、人工智能等科技类新闻;

英文:国外科技类新闻;

社会:社会、娱乐类新闻,满足偶尔看八卦的需求。

每条新闻下载时根据标题关键词确认频道。比如标题包含以下词语的就是科技:

['通信','5G','6G','AI','人工智能','算力','GPT','openAI','云计算','短剧','元宇宙','游戏','影视','电影','AR','VR','TMT','动漫','漫画', '5.5G','头戴式','微软','Google','苹果','生成式','机器人','公有云','大模型','大数据','英伟达','脑机']

HMTL页面-导航栏

        <thead>
        <td><a href="#top">最新</a></td>
        <td><a href="#关注">关注</a></td>
        <td><a href="#要闻">要闻</a></td>
        <td><a href="#快讯">快讯</a></td>
        <td><a href="#时事">时事</a></td>
        <td><a href="#经济">财经</a></td>
        <td><a href="#TMT">科技</a></td>
        <td><a href="#消费">消费</a></td>
        <td><a href="#Tech">英文</a></td>
        <td><a href="#社会">社会</a></td>
        </thead>

新闻HTML页面主要结构:

    {% for i in news %}
        <tr><!-- 频道  体验见 http://101.35.10.13/xw -->
            <th id ={{i[0][-2]}} style="text-align: left;border: 0;background-color: #FFFFF0">{{i[0][-2]}}</th>
            <th style="text-align: left;border: 0;background-color: #FFFFF0"><a href="#top" >{{i[0][-1]}}</a></th>
            <th colspan ="12" style="border: 0;background-color: #FFFFF0"></th>
        </tr>

        {% for j in i %}
        <tr><th colspan ="14" style="font-size: 16px;text-align: left;padding: 5px">
            <!-- 标题和链接  -->
            <a href="javascript:;" onclick="show_full_news('{{j[2]}}')"> {{j[0]}}</a>
        </th></tr>
        <tr>
            <!-- 摘要 -->
            <td colspan ="14" style="font-size: 14px;text-align: left;padding: 5px">{{j[1]}}&nbsp{{j[3]}}</td>
        </tr>
        {% endfor %}

    {% endfor %}

Flask代码:

#新闻
@app.route('/xw')
def news():

    ua = request.headers.get('User-Agent')
    mb = from_mobile(ua)

    try:acct = session['acct']
    except:acct = ''
    
    file = 'news_mb.html' if mb else 'news.html'

    #返回新闻,acct用于加载关注新闻关键词,若空,则无关注新闻
    news = chs_news(acct,60,mb)

    return render_template(file,news = news)

这就是下载新闻、展现新闻的主要思路和技术。当然还有很多细节,如果大家有兴趣,后面详细说。若有疑问,尽管留言。


原文地址:https://blog.csdn.net/Jagua/article/details/143723401

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!