Skip to content

程序员灯塔

Menu
  • Download
  • sitemap
  • 文章归档
  • 标签归档
  • 示例页面
Menu

从mysql读取配置,定期删除hdfs上的文件

Posted on 2017 年 7 月 27 日

 

1 mysql表结构

 

2 定义mysql连接信息

TABLE=data_cycle
HOST_NAME=”mysql.data.xxx.com.cn”
DB_NAME=”suda_portal_data”
USER_NAME=”suda”
PASSWD=”xxxxx”
MYSQL_ETL=”mysql -h $HOST_NAME -P4053 -D$DB_NAME -u$USER_NAME -p$PASSWD -N –default-character-set=utf8 -e “

 

3 查询出需要删除的记录写到文件

sql_get=”SELECT * FROM $TABLE;”
$MYSQL_ETL “$sql_get” > new_user.txt

 

4 按行读文件开始删除

# 用到awk 取每行的字段

cycle=""
cat new_user.txt | while read line
do
# 获取参数
user=`echo "$line" | awk -F '\t' '{print $1}'`
prefix=`echo "$line" | awk -F '\t' '{print $2}'`
path=`echo "$line" | awk -F '\t' '{print $3}'`
cycle=`echo "$line" | awk -F '\t' '{print $4}'`
format=`echo "$line" | awk -F '\t' '{print $5}'`

str=$cycle" days ago"
echo $cycle
# 拼接路径格式
lastday=`date –date="$str" +$format`
echo $lastday
echo $path$prefix$lastday

hadoop fs -rmr $path$prefix$lastday

done

近期文章

  • 技术网站
  • 世界,您好!
  • Git学习记录(learngitbranching.js.org)
  • 阿里职场潜规则
  • 寻找两个正序数组的中位数

近期评论

  1. 一位 WordPress 评论者 发表在 世界,您好!

归档

  • 2024 年 9 月
  • 2024 年 3 月
  • 2022 年 12 月
  • 2021 年 8 月
  • 2021 年 6 月
  • 2021 年 3 月
  • 2021 年 2 月
  • 2020 年 11 月
  • 2020 年 5 月
  • 2020 年 3 月
  • 2019 年 11 月
  • 2019 年 10 月
  • 2019 年 9 月
  • 2019 年 7 月
  • 2019 年 6 月
  • 2019 年 5 月
  • 2019 年 3 月
  • 2018 年 9 月
  • 2018 年 8 月
  • 2018 年 7 月
  • 2018 年 4 月
  • 2018 年 2 月
  • 2018 年 1 月
  • 2017 年 12 月
  • 2017 年 11 月
  • 2017 年 10 月
  • 2017 年 8 月
  • 2017 年 7 月

分类目录

  • 未分类
©2025 程序员灯塔 | Design: Newspaperly WordPress Theme