.Blog
- .HEXO
  - GitHub Actions 来自动部署 Hexo
  - hexo同步备份到onedrive
  - nodejs版本导致hexo生成空白页面
  - 从typecho迁移到Hexo特殊字符和python3修改版
  - 修复hexo花括号显示为字符串123和125
  - 利用winwin hexo editor、inotifywait和rsync在宝塔上搭建后台在线编辑hexo文章
  - 在hexo上使用mermaid流程图
  - 通过hexo deployer rsync部署Hexo博客到VPS主机
- .Typecho
  - Typecho SlideShow插件
  - Typecho 判断当前页面
  - typecho 在mysql中去掉重复数据 typecho 查重、去重
  - typecho如何开启https访问
  - typecho输出一级二级子菜单目录的修改记录
  - 在阿里云上开启typecho的伪静态并隐藏index php
  - 通过修改mysql批量更改typecho的文章图片链接地址
- .WordPress
  - WordPress开启https并解决后台无限重定向
  - WordPress新建页面、文章单独加载指定JavaScript或CSS代码
  - 在WordPress博客文章中插入Html代码块

.Database
- .MongoDB
  - MongoDb 查询并显示集合中重复的数据
  - pymongo 来实现autocomplete的思路
  - 在Ubuntu上安装MongoDB PHP Driver 遇到过的坑
  - 如何重启mongodb
  - 宝塔上使用mongodb的使用方法和注意事项
  - 宝塔面板 mongodb 允许外网访问
- .MySQL
  - pandas读取mysql数据
  - python保存mysql数据
  - 阿里云VPS连接宝塔 mysql出现 2003错误

.Docker
- Docker-compose启动停止删除
- Docker容器连接本地数据库mysql
- Docker容器镜像删除
- win10下wls2中docker挂载（-v）路径
- 如何进入、退出docker的container

.Excel
- Excel表格中删除筛选出来的部分
- 如何在EXCEL将六位数日期改成8位数
- 如何在EXCEL自动计算日期并跳过周六日

.Python
- .Basics
  - pip 的高阶玩法
  - python AES加密解密,key的长度不受限制
  - python中并行遍历：zip和map
  - python中的format函数的使用
  - python测试代码运行速度
  - 利用windows batch（bat）定时运行python脚本
  - 后台运行python 和查看后台运行中的python程序
  - 在google colab中安装python包
  - 如何利用python删除文件
  - 如何利用python批量修改文件名
- .FastAPI
  - github actions 上传commits到VPS并自动部署
  - 利用Docker打包部署python下的FastApi
  - 利用FastAPI为wordpress弄一个API接口：WebStack Pro的API后端部署
  - 利用FastAPI为wordpress弄一个API接口：WebStack Pro的前端部署
- .Flask
  - 使用Supervisor和Gunicorn部署Flask
  - 关闭运行中的gunicorn flask
  - 在docker下使用flask apscheduler并启动cron
  - 用docker部署flask gunicorn nginx后续
- .Jupyterlab
  - 修改Jupyter Notebook的默认路径
  - 在Hexo博文中嵌入Jupyter notebook
  - 在VPS 上的Docker里安装JupyterLab，外挂目录
  - 如何启动、停用vps上运行中的jupyter notebook
  - 快速保存图片image
- .OS
  - 列举当前目录的所有文件及文件夹的名字
  - 获取某路径下最新的文件夹
  - 遍历指定文件夹下所有文件
- .PaddleSpeech
  - 利用FFmpeg提取、转换、分割wav文件
  - 基于PaddleSpeech搭建语音转文字服务
- .Pandas
  - columns互换或重新排序
  - 利用TuShare计算各股票间的相关性和协方差
  - 如何利用TuShare和Python计算移动平均线
  - 如何去掉Tushare数据中的ST股票
  - 如何将pandas的数据去除科学记数法、并带有千份号，逗号
  - 将单列column分成两列
  - 狗血的pandas where函数 mask 函数和 where 作用刚好相反
- .Pyecharts
  - 首次公开发行股票申请企业情况的数据爬取，pyecharts和表格生成（一）
  - 首次公开发行股票申请企业情况的数据爬取，pyecharts和表格生成（三）
  - 首次公开发行股票申请企业情况的数据爬取，pyecharts和表格生成（二）
  - 首次公开发行股票申请企业情况的数据爬取，pyecharts和表格生成（四）
- .Pyspider
  - PySpider问题记录
  - centos 7安装pyspider 所需的phantomjs
  - 使用pyspider下载meizitu com的图片
  - 使用supervisor管理pyspider进程
  - 宝塔安装pyspider的全过程
- .Scikit Learn
  - Scikit Learn 股票投资：p10
  - Scikit Learn 股票投资：p11
  - Scikit Learn 股票投资：p12
  - Scikit Learn 股票投资：p13
  - Scikit Learn 股票投资：p14
  - Scikit Learn 股票投资：p15
  - Scikit Learn 股票投资：p16
  - Scikit Learn 股票投资：p17
  - Scikit Learn 股票投资：p18
  - Scikit Learn 股票投资：p19
  - Scikit Learn 股票投资：p20
  - Scikit Learn 股票投资：p21
  - Scikit Learn 股票投资：p22
  - Scikit Learn 股票投资：p23
  - Scikit Learn 股票投资：p24
  - Scikit Learn 股票投资：p25
  - Scikit Learn 股票投资：p4
  - Scikit Learn 股票投资：p5
  - Scikit Learn 股票投资：p6
  - Scikit Learn 股票投资：p7
  - Scikit Learn 股票投资：p8
  - Scikit Learn 股票投资：p9
  - Scikit Learn 股票投资：前言
  - sklearn 中 OrdinalEncoder 和 LabelEncoder 的不同
  - sklearn 的fetch mldata无法导入的解决办法
  - sklearn模型调优中的learning curve 和 validation curve

.VPS相关
- Ubuntu go语言的卸载
- VPS上使用宝塔安装多网站 wordpres typecho 和 gunicorn ngnix Flask并存
- VPS上的ubuntu初装更新packges
- VPS（ubuntu）上使用SSH证书密钥登陆
- VPS（ubuntu）上修改SSH远程连接端口号
- linux上设置代理set proxy
- nginx上的静态网页在访问的时候没有html后缀
- php composer工具实现更新到最新版本
- ubuntu设置smb实现局域网文件共享
- 修改调整vps 中 linux的时间为北京时间和时区
- 在ubuntu上安装删除docker compose的各种坑
- 在ubuntu下使用crontab 定时执行python任务
- 如何停止宝塔运行中的定时任务
- 如何在Ubuntu 18 04 amp 16 04 LTS 上安装Go 1 12
- 更换$$服务端口
- 查找linux的大文件
- 锁定Linux DNS

.Vuejs
- 01东方财富API实现即时搜索

.其他
- 7zip批量压缩不同文件夹到不同压缩包
- Github Desktop设置代理
- .Thought
  - 我回国后颓废的日子如何在上下班时间提高口语？！
  - 请推荐牛股。。。。
- cmd 快速打开指定文件夹
- 使用 Cron 定时重启 Openwrt 路由器
- 保持github fork 于最新的状态

.应用推荐
- EasyImage：简单图床
- Hellohao：响应式图床站
- ImgURL：开源图床
- Mrdoc：基于Python的在线文档系统
- RustDesk：利用tailscale打洞直连
- Shiori：类似Pocket的网页书签收藏夹
- Superset：大数据可视化开源工具
- Tailscale：宝塔自建Derp服务器
- bitwarden：密码管理器
- .frp
  - ubuntu下设置frp开机启动并后台运行
  - windows下Frp设置开机自动启动
  - 使用frp进行内网穿透
- miniflux：rss阅读器
- picx：基于GitHubAPI搭建的图床
- sharelist：分享下载 GoogleDrive OneDrive
- wallabag：保存网页、稍后阅读

基于PaddleSpeech搭建语音转文字服务

▌分割、转换wav语音文件

首先从手机中导出录音文件，一般是wav或者m4a格式，所以可以通过我之前写的文章利用FFmpeg提取、转换、分割wav文件来分割、转换文件格式。

ffmpeg -i input.wav -f segment -segment_time 49 -c copy -ac 2 -ar 16000 out%03d.wav

上面的意思是：

input.wav 为wav格式的输入音频文件
-segment_time 49 将文件分割为49秒一个
-ac 2 双声道
-ar 16000 转换为16khz 的采样率

▌音频转文本

▌1.PaddleSpeech简介

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型，一些典型的应用如下：

语音识别
语音翻译
语音合成

github: https://github.com/PaddlePaddle/PaddleSpeech

▌PaddleSpeech安装

pip install paddlespeech

我是在windows10 的wls2上安装成功的，反而在mac上失败，暂时没有去研究处理。

▌实现代码

from paddlespeech.cli.asr.infer import ASRExecutor
import csv
import os
import paddle
import csv
import warnings
warnings.filterwarnings('ignore')

asr_executor = ASRExecutor()

def audio2txt(path):
    # 返回path下所有文件构成的一个list列表
    print(f"path: {path}")
    filelist = os.listdir(path)
    # 保证读取按照文件的顺序
    filelist.sort(key=lambda x: int(os.path.splitext(x)[0][3:]))
    # 遍历输出每一个文件的名字和类型
    words = []
    for file in filelist:
        print(path + '/' + file)
        text = asr_executor(
            audio_file=path + '/' + file,
            device=paddle.get_device(), force_yes=True) # force_yes参数需要注意
        words.append(text)
    return words

# 保存
def txt2csv(name, txt_all):
    with open(f'{name}.csv', 'w', encoding='utf-8') as f:
        f_csv = csv.writer(f)
        for row in txt_all:
            f_csv.writerow([row])

path = "分割后的音频文件目录地址"
# 音频转文本  需要GPU
txt_all = audio2txt(path)
# 存入csv
txt2csv(path, txt_all)

参考：

【超简单】之基于PaddleSpeech搭建个人语音听写服务

阅读量: | 柯西君_BingWong | 2023-02-16

利用FFmpeg提取、转换、分割wav文件

columns互换或重新排序