因此,我有以下字符串,我从一个XML源代码中获得:

string text=@" ⏩ മരണം << രണ്ടാം പാപ്പാനായ >> മകന്റെ കൺമുന്നിൽ ’’";

如果您将看到这里的字符集,我将从XML源代码中获得确切的字符’’.

我可以使用以下正则表达式删除<<>>:

[^\\u0900-\\u0dff^\\u0000-\\u00ff]

但最重要的人物并没有被删除.你能指导我如何继续处理这些角色吗?

. NET Fiddle:https://dotnetfiddle.net/E4fL9c

第101章:第https://regex101.com/r/6dW1qZ/1

推荐答案

你似乎在试图删除任何非马拉雅拉姆语字符.Unicode标准有几个预定义的块,例如字母,标点和语言特定的范围.

在. NET正则表达式中,您可以使用\p{Name}包含Unicode named block中的字符,或者使用\P{Name}排除它们.在问题的情况下,您可以将所有非马拉雅拉姆语字符替换为:

var text2=Regex.Replace(str, @"\P{IsMalayalam}", "");

Csharp相关问答推荐

如何使用C#和Graph API从Azure Directory获取用户详细信息

如何使用C#中的图形API更新用户配置文件图像

如何使用C#Interop EXCEL创建度量衡

附加标题不起作用,而添加则起作用

Azure函数中实体框架核心的依赖注入

Blazor在FluentButton onClick事件上设置参数

调用Task.Run()与DoSomethingAsync()有什么不同?

为什么C#认为这个非托管 struct 有一个重叠

如何在CSharp中将json字符串转换为DataTable?

当使用Dapper映射DBNull时,我可以抛出异常吗?

等待一个等待函数

在C#ASP.NET内核中使用INT AS-1进行控制器场景的单元测试

如何使用类似于[SELECT*FROM&Q;&Q;WHERE&Q;]SQL查询的System.Data.Entity创建查询?

用MongoDB c#驱动程序删除和返回嵌套数组中的文档

将字符串类型日期输入(yyyy-mm-ddthh:mm:ss)转换为MM/dd/yyyy格式

Azure函数正在返回值列表,但该列表在Chrome中显示为空

在C#和HttpClient中使用REST API

在C#中通过Matheval使用自定义公式

不寻常的C#语法

MudRadioGroup不切换