易表在线答疑技术与交流用户社区 → 请教字符串中 汉字、数字、英文字母 区分问题


  共有7864人关注过本帖树形打印复制链接

主题:请教字符串中 汉字、数字、英文字母 区分问题

帅哥哟,离线,有人找我吗?
紫莲花
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
请教字符串中 汉字、数字、英文字母 区分问题  发帖心情 Post By:2007/9/21 23:40:00 [显示全部帖子]

[这个贴子最后由紫莲花在 2007/09/21 11:50pm 第 1 次编辑]

egd文件下载

请教 "区号" "楼号" 列公式.


规则:

一\地址中的"-" 前为区号和楼号.     汉字部分为区号. 数字(或英文)为楼号.  (有#号的,去掉#号)
例:
地址                   区号               楼号.    单元    楼层   门号
阳光馨园二期8#-222   阳光馨园二期         8        2      2      2
金世纪商业广场C-5#   金世纪商业广场       C


二\地址中 ,第一位为英文的,英文部分,为区号.
例:
地址                  区号                 楼号
xq10-10-112           xq                   10

三\地址中,第一位为数字的.第一个数字为区号.  "-"前全部数字为楼号.
例:
地址                   区号               楼号
934-312                9                  934

四\若电话类别不是住宅.则区号\楼号.为 "".


忘了说了。dhgl 表中,是原数据。  “效果”表中,是我手动输入的想要达到的效果 。
两表做了关联为了方便看到公式转换的结果。




-=-=-=- 以下内容由 紫莲花2007年09月21日 11:52pm 时添加 -=-=-=-
估计 Czy 版主又要批评我问题提的太长。要闪了。

这个问题说简单点就是:怎么区分字分串中的字母、数字、汉字。


 回到顶部
帅哥哟,离线,有人找我吗?
紫莲花
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
  发帖心情 Post By:2007/9/22 11:48:00 [显示全部帖子]

回复楼上两位朋友。

并非我在出题。

地址一列数据,出自旧系统(其它程序做出来的系统)。我现在想用易表做个新系统,将地址列 分成 区号 楼号 以及 单元 楼层 门号几项,方便统计。因原数据过多,完全用手工来导入旧数据,太过麻烦。所以,想个转换表,对旧数据进行一下转换,个别转换不准确的,再进行手工输入。单元、楼层、门号,几项,我已经写出公式,所以,在上传的文件中,做了隐藏列,免得看着太乱。

至于 WJQ 朋友所说的地址和区号里都有汉字,那是因为区号列的内容,本身就是地址数据中的一部分来的。就是地址中的汉字部分。又不完全是汉字。

我想了很长时间,想不出来办法,所以,才贴上来向大家请教 。

各位也没有什么好办法,那我只好自己再去想办法了。



-=-=-=- 以下内容由 紫莲花2007年09月22日 11:49am 时添加 -=-=-=-

再次感谢楼上两位朋友的热情回复!


 回到顶部
帅哥哟,离线,有人找我吗?
紫莲花
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
  发帖心情 Post By:2007/9/22 19:27:00 [显示全部帖子]

是的.正如两位版主所言,原数据输入的极不规范。(示例中,是我从旧数据中挑出来的代表性的记录,对于每种同样输入方式的记录,都有好上百条。)所以,这次更换系统,我想把数据输入方式统一,避免再出现这种输入不规范、不方便统计的情形。

我想采用的办法是分段。将原来在一个格中输入的内容,拆分成几段输入。这就出现了对旧数据的拆分问题。我一直想能做个完整的转换系统,实现旧数据的平移,现在看来,要想所有的数据都平移,非常困难。也许反倒不如手工来的更直观更快捷了。只是要把需要转换的项都要记下来,避免有漏项。

这个贴子提到的问题,下午我试了一下用手工输入,区号还好解决。楼号,要麻烦一些。正象版主所言,如果加上所有的判断,数据转换时的运行都会困难。我打算,先把带汉字的地址筛选掉,然后对数字地址进行拆分了。再对汉字带楼号的进行处理。不带楼号的,转换为“”了。

谢谢各位版主的关注 。不用再把精力放在这个问题上了!


 回到顶部
帅哥哟,离线,有人找我吗?
紫莲花
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
  发帖心情 Post By:2007/9/22 22:35:00 [显示全部帖子]


我将程版的公式放入我的文件,用全部数据进行测试.发现对于地址为数字形式的,拆分准确,汉字地址,拆分,还是有不准的地方,就如CZY 版主所言,文件中还包含有示例文件中所没有的文字,造成准确度的下降.仍有很多数据需要进行手工的调整.

再次感受到不规范数据带来的麻烦.更加大了我要规范数据的信心.

感谢程版花费时间帮我做出的公式, EVAL 的转换,就不用再做了.

原数据太不规范.即使做出EVAL 版的,恐也无法提高转换的准确度.

所以,我觉得在现有转换的基础上进行手工修改就可以了.

再次感谢两位版主的帮助.


 回到顶部
帅哥哟,离线,有人找我吗?
紫莲花
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
  发帖心情 Post By:2007/9/22 23:48:00 [显示全部帖子]

嗯.是这样的.其实程版做的,转换准确度已经很高了.我看到他的转换结果都有点吃惊.没想到能转换到这个程度.
怪只怪原来的数据,太乱了.乱得没有个一定的规律.一楼中我所提到的那四条,还是我想了好久才总结出来的基本规律.

 回到顶部
帅哥哟,离线,有人找我吗?
紫莲花
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:新手上路 帖子:207 积分:0 威望:0 精华:0 注册:2007/7/10 16:20:00
  发帖心情 Post By:2007/9/23 0:10:00 [显示全部帖子]

我原来的想法,想偷懒不用手工去修改.呵呵.说的好听点就是:有点太追求完美了.但肯定还是要有一定程度的手工修改的.

你做的,已经达到我的要求了.嘿嘿.

再次感谢 !!!!

-=-=-=- 以下内容由 紫莲花2007年09月23日 00:12am 时添加 -=-=-=-
我正在把这个地址数据拆分和以前的入线列的数据拆分数据往一起合并.合并起来,也是比较麻烦的.

刷新一列数据,都要10分钟左右.如果全表一起刷新,,,,,,哎,我还一次没见过,等不到那么久,每次都是停止响应了.


 回到顶部