序列化/反序列化对象到/从分隔字符串
问题描述:
说我有一个案例类,如:序列化/反序列化对象到/从分隔字符串
case class User(id: Int, name: String, age: Int)
,这也是存储在一个文件,其中每行的样子:
123|"john"|35
我希望在一个用户对象和字符串表示之间来回执行此分析。
在Scala中做这件事的最好方法是什么?
我知道我可以做一个字符串拆分,但想知道如果他们是一个更清洁的方法和更习惯。
答
/**
* Serialization/deserialization API
*/
trait Codec[T] {
def parse(str: String):Option[T]
def write(u: T): String
implicit def string2type(str: String):Option[T] = parse(str)
implicit def type2string(u: T):String = write(u)
implicit def iterable2type(it: Iterable[String]):Iterable[T] =
it.flatMap(string2type)
}
/**
* Serialization/deserialization implementation for User
*/
object UserCodec extends Codec[User] {
val pattern = """(\d+)\|"([\w\s]+)"\|(\d+)""".r
override def parse(str: String):Option[User] = str match {
case pattern(id, name, age) => Some(User(id.toInt, name, age.toInt))
case _ => None
}
override def write(u: User): String = s"""${u.id}|"${u.name}"|${u.age}"""
}
用法:
def main(args: Array[String]): Unit = {
import UserCodec._
val str = """123|"john asd"|35"""
val u:Option[User] = str
val s:String = User(1, "a", 1)
println(u) // out: Some(User(123,john asd,35))
println(s) // out: 1|"a"|1
}
UPD: 实例与iterables:
def main(args: Array[String]): Unit = {
import UserCodec._
val lines = Seq(
"""1|"john"|34""",
"""2|"bill"|35""",
"""3|"aaa"|36"""
)
val validUsers: Iterable[User] = lines
println(validUsers.toList)
//out:List(User(1,john,34), User(2,bill,35), User(3,aaa,36))
}
要做到这一点正确的方式,你需要写一个完整的解析器来妥善处理所有情况。 –
使用像https://github.com/tototoshi/scala-csv这样的库,并将字段分隔符设置为'|'字符,然后将每个读取的行映射到您的案例大小值。 – Yawar